为什么 SQL Server 为其限定的表的每一行运行一个子查询？

Question

为什么 SQL Server 为其限定的表的每一行运行一个子查询？

Cap*_*ock 8 optimization database-tuning sql-server-2008-r2 subquery

此查询在 ~21 秒内运行（执行计划）：

select 
    a.month
    , count(*) 
from SubqueryTest a 
where a.year = (select max(b.year) from SubqueryTest b)
group by a.month

Run Code Online (Sandbox Code Playgroud)

当子查询被变量替换时，它会在 <1 秒内运行（执行计划）：

declare @year float
select @year = max(b.year) from SubqueryTest b
select 
    month
    , count(*) 
from SubqueryTest where year = @year group by month

Run Code Online (Sandbox Code Playgroud)

从执行计划来看，“select max...”子选择对“SubqueryTest a:”中的数百万行中的每一行都运行，这就是为什么它需要这么长时间。

我的问题：由于子选择是标量、确定性且不相关，为什么查询优化器不执行我在第二个示例中所做的操作并运行子查询一次，存储结果，然后将其用于主查询？我确定我对 SQL Server 的理解只是一个漏洞，但我真的很想帮助填补它 - 用谷歌几个小时没有帮助。

该表刚超过 1GB，有近 2800 万条记录：

CREATE TABLE SubqueryTest(
  [pk_id] [int] IDENTITY(1,1) NOT NULL
  , [Year] [float] NULL
  , [Month] [float] NULL PRIMARY KEY CLUSTERED ([pk_id] ASC))

CREATE NONCLUSTERED INDEX idxSubqueryTest ON SubqueryTest ([Year] ASC)

Run Code Online (Sandbox Code Playgroud)

Answer 1

Mar*_*ith 6

慢速计划不计算MAX外部查询中的每一行。

事实上，它根本没有明确计算它。

它给出了一个类似于

WITH CTE
     AS (SELECT TOP(1) WITH TIES *
         FROM   SubqueryTest
         WHERE year IS NOT NULL
         ORDER  BY year desc)
SELECT month,
       count(*)
FROM   CTE
GROUP  BY month

Run Code Online (Sandbox Code Playgroud)

慢速计划（估计行数）

在此处输入图片说明