单行 INSERT...SELECT 比单独的 SELECT 慢得多

Pau*_*ite 18 performance sql-server insert execution-plan query-performance

给定以下堆表,其中包含 400 行,编号从 1 到 400:

DROP TABLE IF EXISTS dbo.N;
GO
SELECT 
    SV.number
INTO dbo.N 
FROM master.dbo.spt_values AS SV
WHERE 
    SV.[type] = N'P'
    AND SV.number BETWEEN 1 AND 400;
Run Code Online (Sandbox Code Playgroud)

以及以下设置:

SET NOCOUNT ON;
SET STATISTICS IO, TIME OFF;
SET STATISTICS XML OFF;
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
Run Code Online (Sandbox Code Playgroud)

以下SELECT语句在大约6 秒内完成(demoplan):

DECLARE @n integer = 400;

SELECT
    c = COUNT_BIG(*) 
FROM dbo.N AS N
CROSS JOIN dbo.N AS N2
CROSS JOIN dbo.N AS N3
WHERE 
    N.number <= @n
    AND N2.number <= @n
    AND N3.number <= @n
OPTION
    (OPTIMIZE FOR (@n = 1));
Run Code Online (Sandbox Code Playgroud)

注意:@TheOPTIMIZE FOR子句只是为了生成一个合理大小的重现,以捕获实际问题的基本细节,包括可能由于各种原因出现的基数错误估计。

将单行输出写入表时,需要19 秒demoplan):

DECLARE @T table (c bigint NOT NULL);

DECLARE @n integer = 400;

INSERT @T
    (c)
SELECT
    c = COUNT_BIG(*) 
FROM dbo.N AS N
CROSS JOIN dbo.N AS N2
CROSS JOIN dbo.N AS N3
WHERE 
    N.number <= @n
    AND N2.number <= @n
    AND N3.number <= @n
OPTION
    (OPTIMIZE FOR (@n = 1));
Run Code Online (Sandbox Code Playgroud)

除了插入一行之外,执行计划看起来完全相同。

所有额外的时间似乎都被 CPU 使用消耗了。

为什么INSERT语句这么慢?

Pau*_*ite 21

SQL Server 选择使用行级锁扫描循环连接内侧的堆表。完整扫描通常会选择页级锁定,但表的大小和谓词的组合意味着存储引擎选择行锁,因为这似乎是最便宜的策略。

基数misestimation故意引入的OPTIMIZE FOR装置,所述堆被扫描许多比优化希望更多倍,并且它不引入卷轴,因为它通常会。

这种因素的组合意味着性能对运行时所需的锁数量非常敏感。

SELECT语句受益于一种优化,当没有读取未提交数据的危险并且没有行外数据时,该优化允许跳过行级共享锁(仅采用意向共享页级锁)。

INSERT...SELECT语句不会从这种优化中受益,因此在第二种情况下,每秒获取和释放数百万个 RID 锁,以及意图共享的页面级锁。

大量的锁定活动导致了额外的 CPU 和运行时间。

最自然的解决方法是确保优化器(和存储引擎)获得合适的基数估计,以便他们做出正确的选择。

如果这在实际用例中不切实际,则可以将INSERTandSELECT语句分开,并将结果SELECT保存在变量中。这将使SELECT语句受益于锁跳过优化。

也可以通过不使用共享锁或确保快速进行锁升级来更改隔离级别。

作为最后一个兴趣点,SELECT通过使用未记录的跟踪标志 8691 强制使用假脱机,可以使查询运行得比优化的情况更快。