为什么这个带有参数的递归 CTE 在使用文字时不使用索引?

bin*_*nki 9 sql-server optimization cte execution-plan recursive

我在树结构上使用递归 CTE 来列出树中特定节点的所有后代。如果我在我的WHERE子句中写了一个文字节点值,SQL Server 似乎实际上只是将 CTE 应用于该值,给出一个实际行数较低的查询计划,等等

带有文字值的查询计划

但是,如果我将该值作为参数传递,它似乎实现了(假脱机)CTE,然后在事后对其进行过滤

带参数值的查询计划

我可能读错了计划。我没有注意到性能问题,但我担心 CTE 的实现可能会导致较大数据集出现问题,尤其是在繁忙的系统中。此外,我通常将这种遍历本身复合:我遍历祖先并返回后代(以确保收集所有相关节点)。由于我的数据如何,每组“相关”节点都相当小,因此实现 CTE 没有意义。当 SQL Server 似乎意识到 CTE 时,它在“实际”计数中给了我一些相当大的数字。

有没有办法让查询的参数化版本表现得像文字版本?我想把 CTE 放在一个可重用的视图中。

用文字查询:

CREATE PROCEDURE #c AS BEGIN;
    WITH descendants AS (SELECT
         t.ParentId Id
        ,t.Id DescendantId
    FROM #tree t
    WHERE t.ParentId IS NOT NULL
    UNION ALL SELECT
         d.Id
        ,t.Id DescendantId
    FROM descendants d
    JOIN #tree t ON d.DescendantId = t.ParentId)
    SELECT d.*
    FROM descendants d
    WHERE d.Id = 24
    ORDER BY d.Id, d.DescendantId;
END;
GO
EXEC #c;
Run Code Online (Sandbox Code Playgroud)

带参数查询:

CREATE PROCEDURE #c (@Id BIGINT) AS BEGIN;
    WITH descendants AS (SELECT
         t.ParentId Id
        ,t.Id DescendantId
    FROM #tree t
    WHERE t.ParentId IS NOT NULL
    UNION ALL SELECT
         d.Id
        ,t.Id DescendantId
    FROM descendants d
    JOIN #tree t ON d.DescendantId = t.ParentId)
    SELECT d.*
    FROM descendants d
    WHERE d.Id = @Id
    ORDER BY d.Id, d.DescendantId;
END;
GO
EXEC #c 24;
Run Code Online (Sandbox Code Playgroud)

设置代码:

DECLARE @count BIGINT = 100000;
CREATE TABLE #tree (
     Id BIGINT NOT NULL PRIMARY KEY
    ,ParentId BIGINT
);
CREATE INDEX tree_23lk4j23lk4j ON #tree (ParentId);
WITH number AS (SELECT
         CAST(1 AS BIGINT) Value
    UNION ALL SELECT
         n.Value * 2 + 1
    FROM number n
    WHERE n.Value * 2 + 1 <= @count
    UNION ALL SELECT
         n.Value * 2
    FROM number n
    WHERE n.Value * 2 <= @count)
INSERT #tree (Id, ParentId)
SELECT n.Value, CASE WHEN n.Value % 3 = 0 THEN n.Value / 4 END
FROM number n;
Run Code Online (Sandbox Code Playgroud)

Pau*_*ite 12

Randi Vertongen 的回答正确地解决了如何使用查询的参数化版本获得所需的计划。如果您对详细信息感兴趣,此答案通过解决问题的标题来补充这一点。

SQL Server 将尾递归公用表表达式 (CTE) 重写为迭代。从Lazy Index Spool 开始,一切都是迭代翻译的运行时实现。我写了一个详细说明的执行计划,这部分如何工作的答案,以使用除了在递归公用表表达式

您想在 CTE之外指定一个谓词(过滤器),并让查询优化在递归(重写为迭代)内部将此过滤器向下推,并将其应用于锚点成员。这意味着递归仅从匹配的记录开始ParentId = @Id

这是一个相当合理的期望,无论是使用文字值、变量还是参数;但是,优化器只能执行已为其编写规则的操作。规则指定如何修改逻辑查询树以实现特定转换。它们包括确保最终结果安全的逻辑——即它在所有可能的情况下返回与原始查询规范完全相同的数据。

负责在递归 CTE 上推送谓词的规则称为SelOnIterator- 实现递归的迭代器上的关系选择(= 谓词)。更准确地说,此规则可以将选择复制到递归迭代的锚点部分:

Sel(Iter(A,R)) -> Sel(Iter(Sel(A),R))
Run Code Online (Sandbox Code Playgroud)

可以使用未记录的提示禁用此规则OPTION(QUERYRULEOFF SelOnIterator)。当使用它时,优化器不能再将带有文字值的谓词下推到递归 CTE 的锚点。你不想那样,但它说明了这一点。

最初,此规则仅限于处理仅具有文字值的谓词。也可以通过指定来处理变量或参数OPTION (RECOMPILE),因为该提示启用Parameter Embedding Optimization,从而在编译计划时使用变量(或参数)的运行时文字值。该计划未缓存,因此其缺点是每次执行时都进行全新编译。

在某些时候,该SelOnIterator规则得到了改进,可以处理变量和参数。为了避免意外的计划更改,这受到 4199 跟踪标志、数据库兼容性级别和查询优化器修补程序兼容性级别的保护。这是优化器改进的一种非常正常的模式,并不总是记录在案。对于大多数人来说,改进通常是好的,但任何改变都可能会给某人带来倒退。

我想把 CTE 放在一个可重用的视图中

您可以使用内联表值函数而不是视图。提供要下推的值作为参数,并将谓词放置在递归锚点成员中。

如果您愿意,也可以选择全局启用跟踪标志 4199。此标志涵盖了许多优化器更改,因此您需要在启用它的情况下仔细测试您的工作负载,并准备好处理回归。


Ran*_*gen 10

虽然目前我没有实际修补程序的标题,但在您的版本 (SQL Server 2012) 上启用查询优化器修补程序时,将使用更好的查询计划。

其他一些方法是:

  • 使用OPTION(RECOMPILE)so 过滤发生得更早,在文字值上。
  • 在 SQL Server 2016 或更高版本上,此版本之前的修补程序会自动应用,并且查询也应与更好的执行计划等效运行。

查询优化器修补程序

您可以启用这些修复

  • SQL Server 2016 之前的跟踪标志 4199
  • ALTER DATABASE SCOPED CONFIGURATION SET QUERY_OPTIMIZER_HOTFIXES=ON; 从 SQL Server 2016 开始。(修复不需要)

@id在启用修补程序的情况下,过滤 on较早应用于执行计划中的递归和锚点成员。

可以在查询级别添加跟踪标志:

OPTION(QUERYTRACEON 4199)
Run Code Online (Sandbox Code Playgroud)

在带有 Traceflag 4199 的 SQL Server 2012 SP4 GDR 或 SQL Server 2014 SP3 上运行查询时,会选择更好的查询计划:

ALTER PROCEDURE #c (@Id BIGINT) AS BEGIN;
    WITH descendants AS (SELECT
         t.ParentId Id
        ,t.Id DescendantId
    FROM #tree t 
    WHERE t.ParentId IS NOT NULL
    UNION ALL 
    SELECT
         d.Id
        ,t.Id DescendantId
    FROM descendants d
    JOIN #tree t ON d.DescendantId = t.ParentId)
    SELECT d.*
    FROM descendants d
    WHERE d.Id = @Id
    ORDER BY d.Id, d.DescendantId
    OPTION( QUERYTRACEON 4199 );

END;
GO
EXEC #c 24;
Run Code Online (Sandbox Code Playgroud)

带有跟踪标志 4199 的 SQL Server 2014 SP3 上的查询计划

带有跟踪标志 4199 的 SQL Server 2012 SP4 GDR 上的查询计划

SQL Server 2012 SP4 GDR 上的查询计划没有跟踪标志 4199

主要的共识是在使用SQL Server 2016之前的版本时全局启用traceflag 4199。之后是否启用它有待讨论。AQ/A 在这里


兼容级别 130 或 140

在使用compatibility_level= 130 或 140的数据库上测试参数化查询时,过滤发生得更早:

在此处输入图片说明

由于在 SQL Server 2016 及更高版本上启用了跟踪标志 4199 的“旧”修复程序。


选项(重新编译)

即使使用了过程,SQL Server 也可以在添加OPTION(RECOMPILE);.

ALTER PROCEDURE #c (@Id BIGINT) AS BEGIN;
    WITH descendants AS (SELECT
         t.ParentId Id
        ,t.Id DescendantId
    FROM #tree t 
    WHERE t.ParentId IS NOT NULL
    UNION ALL 
    SELECT
         d.Id
        ,t.Id DescendantId
    FROM descendants d
    JOIN #tree t ON d.DescendantId = t.ParentId)
    SELECT d.*
    FROM descendants d
    WHERE d.Id = @Id
    ORDER BY d.Id, d.DescendantId
OPTION(
RECOMPILE )

END;
GO
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

带有选项的 SQL Server 2012 SP4 GDR 上的查询计划(重新编译)