单行 INSERT...SELECT 比单独的 SELECT 慢得多

Question

单行 INSERT...SELECT 比单独的 SELECT 慢得多

Pau*_*ite 18 performance sql-server insert execution-plan query-performance

给定以下堆表，其中包含 400 行，编号从 1 到 400：

DROP TABLE IF EXISTS dbo.N;
GO
SELECT 
    SV.number
INTO dbo.N 
FROM master.dbo.spt_values AS SV
WHERE 
    SV.[type] = N'P'
    AND SV.number BETWEEN 1 AND 400;

Run Code Online (Sandbox Code Playgroud)

以及以下设置：

SET NOCOUNT ON;
SET STATISTICS IO, TIME OFF;
SET STATISTICS XML OFF;
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;

Run Code Online (Sandbox Code Playgroud)

以下SELECT语句在大约6 秒内完成（demo、plan）：

DECLARE @n integer = 400;

SELECT
    c = COUNT_BIG(*) 
FROM dbo.N AS N
CROSS JOIN dbo.N AS N2
CROSS JOIN dbo.N AS N3
WHERE 
    N.number <= @n
    AND N2.number <= @n
    AND N3.number <= @n
OPTION
    (OPTIMIZE FOR (@n = 1));

Run Code Online (Sandbox Code Playgroud)

_{注意：@TheOPTIMIZE FOR子句只是为了生成一个合理大小的重现，以捕获实际问题的基本细节，包括可能由于各种原因出现的基数错误估计。}

将单行输出写入表时，需要19 秒（demo、plan）：

DECLARE @T table (c bigint NOT NULL);

DECLARE @n integer = 400;

INSERT @T
    (c)
SELECT
    c = COUNT_BIG(*) 
FROM dbo.N AS N
CROSS JOIN dbo.N AS N2
CROSS JOIN dbo.N AS N3
WHERE 
    N.number <= @n
    AND N2.number <= @n
    AND N3.number <= @n
OPTION
    (OPTIMIZE FOR (@n = 1));

Run Code Online (Sandbox Code Playgroud)

除了插入一行之外，执行计划看起来完全相同。

所有额外的时间似乎都被 CPU 使用消耗了。

为什么INSERT语句这么慢？

Answer 1

Pau*_*ite 21

SQL Server 选择使用行级锁扫描循环连接内侧的堆表。完整扫描通常会选择页级锁定，但表的大小和谓词的组合意味着存储引擎选择行锁，因为这似乎是最便宜的策略。

基数misestimation故意引入的OPTIMIZE FOR装置，所述堆被扫描许多比优化希望更多倍，并且它不引入卷轴，因为它通常会。

这种因素的组合意味着性能对运行时所需的锁数量非常敏感。

该SELECT语句受益于一种优化，当没有读取未提交数据的危险并且没有行外数据时，该优化允许跳过行级共享锁（仅采用意向共享页级锁）。

该INSERT...SELECT语句不会从这种优化中受益，因此在第二种情况下，每秒获取和释放数百万个 RID 锁，以及意图共享的页面级锁。

大量的锁定活动导致了额外的 CPU 和运行时间。

最自然的解决方法是确保优化器（和存储引擎）获得合适的基数估计，以便他们做出正确的选择。

如果这在实际用例中不切实际，则可以将INSERTandSELECT语句分开，并将结果SELECT保存在变量中。这将使SELECT语句受益于锁跳过优化。

也可以通过不使用共享锁或确保快速进行锁升级来更改隔离级别。

作为最后一个兴趣点，SELECT通过使用未记录的跟踪标志 8691 强制使用假脱机，可以使查询运行得比优化的情况更快。

归档时间：	6 年，8 月前
查看次数：	1126 次
最近记录：	6 年，5 月前