使用OR的这些T-SQL查询之间有什么区别？

Question

使用OR的这些T-SQL查询之间有什么区别？

Mic*_*ter 8 sql-server sql-server-2008 database-performance sql-execution-plan

我使用Microsoft SQL Server 2008(SP1,x64).我有两个相同的查询,或者我认为,但它们具有完全不同的查询计划和性能.

查询1:

SELECT c_pk
FROM table_c
WHERE c_b_id IN (SELECT b_id FROM table_b WHERE b_z = 1)
  OR  c_a_id IN (SELECT a_id FROM table_a WHERE a_z = 1)

Run Code Online (Sandbox Code Playgroud)

查询2:

SELECT c_pk
FROM table_c
LEFT JOIN (SELECT b_id FROM table_b WHERE b_z = 1) AS b ON c_b_id = b_id
LEFT JOIN (SELECT a_id FROM table_a WHERE a_z = 1) AS a ON c_a_id = a_id
WHERE b_id IS NOT NULL
  OR  a_id IS NOT NULL

Run Code Online (Sandbox Code Playgroud)

查询1比我预期的要快,而查询2非常慢.该查询计划看起来完全不同.

我想查询2与查询1一样快.我有使用查询2的软件,我无法将其更改为查询1.我可以更改数据库.

一些问题:

为什么查询计划不同？
我能以某种方式"教"SQL Server查询2等于查询1吗？

所有表都具有(群集的)主键和所有列上的正确索引:

CREATE TABLE table_a (
  a_pk   int NOT NULL PRIMARY KEY,
  a_id   int NOT NULL UNIQUE,
  a_z    int
)
GO
CREATE INDEX IX_table_a_z ON table_a (a_z)
GO

CREATE TABLE table_b (
  b_pk   int NOT NULL PRIMARY KEY,
  b_id   int NOT NULL UNIQUE,
  b_z    int
)
GO
CREATE INDEX IX_table_b_z ON table_b (b_z)
GO

CREATE TABLE table_c (
  c_pk   int NOT NULL PRIMARY KEY,
  c_a_id int,
  c_b_id int
)
GO
CREATE INDEX IX_table_c_a_id ON table_c (c_a_id)
GO
CREATE INDEX IX_table_c_b_id ON table_c (c_b_id)
GO

Run Code Online (Sandbox Code Playgroud)

最初填写后,表格不会被修改.我是唯一一个在询问他们的人.它们包含数百万条记录(table_a:5M,table_b:4M,table_c:12M),但仅使用1%会得到类似的结果.

编辑:我尝试为c_a_id和添加FOREIGN KEYs c_b_id,但这只会使查询1变慢...

我希望有人可以查看查询计划并解释其中的差异.

Answer 1

Adr*_*tti 1

加入速度较慢，这是设计使然。第一个查询使用子查询（可缓存）来过滤记录，因此它将产生更少的数据（以及对每个表的更少访问）。

你读过这些吗：

我的意思是，使用 IN 数据库可以进行更好的优化，例如删除重复项、在第一次匹配时停止等类似的操作（这些来自学校记忆，所以我确信它会做得更好）。所以我想问题不在于 QP 为何不同，而在于优化的深度有多智能。

归档时间：	13 年，11 月前
查看次数：	268 次
最近记录：	13 年，11 月前