HIVE检查表1中的数据,表2中没有

use*_*581 11 sql hive

我希望创建一个HIVE SQL查询来查找表1中表2中没有的所有值.我知道我需要使用连接但是我无法弄清楚如何在这种情况下实现它...

谢谢,詹姆斯

例如:

Table1

url                  number
xe.com               5
google.com           2
ebay.co.uk           6

Table2

url                  visits
facebook.com         8
google.com           4
ebay.co.uk           15
Run Code Online (Sandbox Code Playgroud)

因此,例如,查询应该返回Table2中存在于表2中的所有值,即

url                  number         visits
google.com           2              4
ebay.co.uk           6              15
Run Code Online (Sandbox Code Playgroud)

Ant*_*ist 16

Table1无论是否匹配,LEFT JOIN都将返回所有行.如果没有匹配,则列中的列Table2将具有值NULL- 这些是您想要的行:

SELECT Table1.url, Table1.number
FROM Table1
LEFT OUTER JOIN Table2 ON Table1.url = Table2.url
WHERE Table2.url IS NULL
Run Code Online (Sandbox Code Playgroud)