EXISTS vs JOIN和使用EXISTS子句

sat*_*jit 48 sql sql-server sql-server-2005 sql-server-2008

以下是代码示例:

CREATE TABLE #titles(
    title_id       varchar(20),
    title          varchar(80)       NOT NULL,
    type           char(12)          NOT NULL,
    pub_id         char(4)               NULL,
    price          money                 NULL,
    advance        money                 NULL,
    royalty        int                   NULL,
    ytd_sales      int                   NULL,
    notes          varchar(200)          NULL,
    pubdate        datetime          NOT NULL
 )
 GO

 insert #titles values ('1', 'Secrets',   'popular_comp', '1389', $20.00, $8000.00, 10, 4095,'Note 1','06/12/94')
 insert #titles values ('2', 'The',       'business',     '1389', $19.99, $5000.00, 10, 4095,'Note 2','06/12/91')
 insert #titles values ('3', 'Emotional', 'psychology',   '0736', $7.99,  $4000.00, 10, 3336,'Note 3','06/12/91')
 insert #titles values ('4', 'Prolonged', 'psychology',   '0736', $19.99, $2000.00, 10, 4072,'Note 4','06/12/91')
 insert #titles values ('5', 'With',      'business',     '1389', $11.95, $5000.00, 10, 3876,'Note 5','06/09/91')
 insert #titles values ('6', 'Valley',    'mod_cook',     '0877', $19.99, $0.00,    12, 2032,'Note 6','06/09/91')
 insert #titles values ('7', 'Any?',      'trad_cook',    '0877', $14.99, $8000.00, 10, 4095,'Note 7','06/12/91')
 insert #titles values ('8', 'Fifty',     'trad_cook',    '0877', $11.95, $4000.00, 14, 1509,'Note 8','06/12/91')
 GO


CREATE TABLE #sales(
    stor_id        char(4)           NOT NULL,
    ord_num        varchar(20)       NOT NULL,
    ord_date       datetime          NOT NULL,
    qty            smallint          NOT NULL,
    payterms       varchar(12)       NOT NULL,
    title_id       varchar(80)
)
 GO
insert #sales values('1', 'QA7442.3', '09/13/94', 75, 'ON Billing','1')
insert #sales values('2', 'D4482',    '09/14/94', 10, 'Net 60',    '1')
insert #sales values('3', 'N914008',  '09/14/94', 20, 'Net 30',    '2')
insert #sales values('4', 'N914014',  '09/14/94', 25, 'Net 30',    '3')
insert #sales values('5', '423LL922', '09/14/94', 15, 'ON Billing','3')
insert #sales values('6', '423LL930', '09/14/94', 10, 'ON Billing','2')


SELECT    title, price
FROM      #titles
WHERE     EXISTS
(SELECT   *
FROM      #sales
WHERE     #sales.title_id = #titles.title_id
AND       qty >30)


    SELECT    t.title, t.price
    FROM     #titles t
    inner join #sales s on t.title_id = s.title_id
    where s.qty >30 
Run Code Online (Sandbox Code Playgroud)

我想知道上面两个查询之间有什么区别给出相同的结果.还想知道EXISTS关键字的用途和确切使用的位置?

JNK*_*JNK 100

EXISTS用于返回布尔值,JOIN返回整个其他表

EXISTS仅用于测试子查询是否返回结果,并且一旦发生短路就会发生短路. JOIN用于通过将结果集与来自另一个具有关系的表的其他字段组合来扩展结果集.

在您的示例中,查询在语义上是等效的.

一般情况下,使用EXISTS时:

  • 您无需从相关表中返回数据
  • 您在相关表中有欺骗(JOIN如果重复值,可能会导致重复的行)
  • 你想检查存在(使用而不是LEFT OUTER JOIN...NULL条件)

如果你有适当的索引,大多数时候EXISTS它将具有相同的性能JOIN.例外情况是非常复杂的子查询,通常使用起来更快EXISTS.

如果您的JOIN密钥没有编入索引,可能会更快使用,EXISTS但您需要针对您的具体情况进行测试.

JOIN 语法更容易阅读,也更正常.


gbn*_*gbn 39

  • EXISTS是半连接
  • JOIN是一个加入

所以有3行和5行匹配

  • JOIN给出了15行
  • EXISTS提供3行

结果是其他人提到的"短路"效应,不需要使用带有JOIN的DISTINCT.当寻找1:n关系的n侧存在行时,EXISTS几乎总是更快.

  • @gbn你能用一个真正帮助我的例子证明这一点我是初学者 (3认同)

Aar*_*and 11

EXISTS主要用于快捷方式.本质上,一旦条件为真,优化器就会挽救,因此它可能不需要扫描整个表(在现代版本的SQL Server中,这种优化也可以发生IN(),尽管并非总是如此).这种行为可能因查询而异,在某些情况下,连接实际上可能会为优化器提供更多机会来完成其工作.所以我觉得很难说"这就是你应该使用的时候EXISTS,这就是你不应该这样做的时候"因为,就像许多事情一样,"这取决于它."

也就是说,在这种情况下,由于表之间基本上只有1:1匹配,因此您不太可能看到任何性能差异,优化器可能会产生类似甚至相同的计划.当您为每个标题添加50,000行时,如果比较sales/exists在sales表上,您可能会看到不同的东西(更别提您需要更改连接查询以删除重复项,聚合,有什么).

  • +1依赖于"它取决于".我最近做了很多代码调整,并根据我的信念用'EXISTS`取代`JOIN`条件会更快.当我实际测试时,在大多数情况下它们对我来说是相同的(我认为因为`JOIN`始终在群集键上) (2认同)

cor*_*iKa 6

我发现当我想根据行与其他行的交互方式排除行时,存在最有用。

例如,

SELECT * 
  FROM TABLE a
 WHERE a.val IN (1,2,3)
   AND NOT EXISTS(SELECT NULL
                    FROM TABLE b
                   WHERE b.id = a.id
                     AND b.val NOT IN (1, 2, 3))
Run Code Online (Sandbox Code Playgroud)

在本例中,我a根据具有b相同 id 但无效的记录排除查询中的行。

这其实是我工作中遇到的一个生产问题。该查询将大部分排除逻辑移至查询中而不是应用程序中,将加载时间从超过 24 秒缩短至不到 2 秒。:-)