SQL - 从一个表中查找另一个表中不存在的记录

Phi*_*ton 288 mysql sql

我有以下两个SQL表(在MySQL中):

Phone_book
+----+------+--------------+
| id | name | phone_number |
+----+------+--------------+
| 1  | John | 111111111111 |
+----+------+--------------+
| 2  | Jane | 222222222222 |
+----+------+--------------+

Call
+----+------+--------------+
| id | date | phone_number |
+----+------+--------------+
| 1  | 0945 | 111111111111 |
+----+------+--------------+
| 2  | 0950 | 222222222222 |
+----+------+--------------+
| 3  | 1045 | 333333333333 |
+----+------+--------------+
Run Code Online (Sandbox Code Playgroud)

如何找出调用由人,他们作了phone_number不在Phone_book?期望的输出是:

Call
+----+------+--------------+
| id | date | phone_number |
+----+------+--------------+
| 3  | 1045 | 333333333333 |
+----+------+--------------+
Run Code Online (Sandbox Code Playgroud)

任何帮助将非常感激.

Aln*_*tak 404

有几种不同的方法可以实现这一点,效率各不相同,具体取决于查询优化器的优异程度以及两个表的相对大小:

这是最短的陈述,如果您的电话簿很短,可能会最快:

SELECT  *
FROM    Call
WHERE   phone_number NOT IN (SELECT phone_number FROM Phone_book)
Run Code Online (Sandbox Code Playgroud)

或者(感谢Alterlife)

SELECT *
FROM   Call
WHERE  NOT EXISTS
  (SELECT *
   FROM   Phone_book
   WHERE  Phone_book.phone_number = Call.phone_number)
Run Code Online (Sandbox Code Playgroud)

或者(感谢WOPR)

SELECT * 
FROM   Call
LEFT OUTER JOIN Phone_Book
  ON (Call.phone_number = Phone_book.phone_number)
  WHERE Phone_book.phone_number IS NULL
Run Code Online (Sandbox Code Playgroud)

(忽略这一点,正如其他人所说,通常最好只选择你想要的列,而不是' *')

  • 在一般情况下,左外连接可能是最快的,因为它可以防止重复执行子查询. (23认同)
  • 避免 IN,使用 EXISTS - 提示在问题标题中 (2认同)
  • @Alnitak:在第二个查询中,子查询中不需要`SELECT*`.相反,例如,`SELECT 1`,应该足够了. (2认同)

WOP*_*OPR 82

SELECT Call.ID, Call.date, Call.phone_number 
FROM Call 
LEFT OUTER JOIN Phone_Book 
  ON (Call.phone_number=Phone_book.phone_number) 
  WHERE Phone_book.phone_number IS NULL
Run Code Online (Sandbox Code Playgroud)

应该删除子查询,允许查询优化器发挥其魔力.

另外,避免使用"SELECT*",因为如果有人改变了基础表或视图,它会破坏你的代码(并且效率很低).

  • 这通常是最有效的方法,因为它不会在第二个表上执行多次传递...希望有些人正在阅读这些游戏. (9认同)
  • 我宁愿希望人们介绍:除非你是一位顶尖的SQL性能大师,否则提前告诉最快的是非常困难(并且取决于你使用的DBMS引擎). (3认同)
  • Big O表示法很容易告诉您在这种情况下您可以期望最快的东西.它的数量级不同. (2认同)

Alt*_*ife 24

在处理较大的数据集时,下面的代码比上面给出的答案更有效.

SELECT * FROM Call WHERE 
NOT EXISTS (SELECT 'x' FROM Phone_book where 
Phone_book.phone_number = Call.phone_number)
Run Code Online (Sandbox Code Playgroud)

  • 与往常一样,值得根据目标数据集分析查询的性能,以选择性能最佳的查询。如今,SQL 优化器已经足够好了,其性能结果常常令人惊讶。 (2认同)

Nat*_*Geo 5

我认为

SELECT CALL.* FROM CALL LEFT JOIN Phone_book ON 
CALL.id = Phone_book.id WHERE Phone_book.name IS NULL
Run Code Online (Sandbox Code Playgroud)


Vla*_*ado 5

SELECT DISTINCT Call.id 
FROM Call 
LEFT OUTER JOIN Phone_book USING (id) 
WHERE Phone_book.id IS NULL
Run Code Online (Sandbox Code Playgroud)

这将返回Phone_book表中缺少的额外id-s.