为什么它在做索引查找

sac*_*iee 3 sql-server statistics execution-plan

我创建了一个示例表,如下所示

CREATE TABLE [dbo].[StatisticsDemo](
    [ID] [int] IDENTITY(1,1) NOT NULL,
    [Name] [nvarchar](50) NULL
   ) ON [PRIMARY]
Run Code Online (Sandbox Code Playgroud)

然后我插入以下数据如下:

SELECT NAME,COUNT(*) AS COUNT 
FROM StatisticsDemo 
GROUP BY NAME

NAME    COUNT
-------------
AABBCC  59999
XXYYZZ  1
Run Code Online (Sandbox Code Playgroud)

然后我在下面创建了非聚集索引:

CREATE NONCLUSTERED INDEX [NCI_STATISTICSDEMO_NAME] ON [dbo].[StatisticsDemo]
(
    [Name] ASC
)
Run Code Online (Sandbox Code Playgroud)

现在我运行了以下查询:

SELECT NAME FROM [dbo].[StatisticsDemo] 
WHERE NAME = 'AABBCC'
Run Code Online (Sandbox Code Playgroud)

正如预期的那样,它返回 59999 行,但它正在对非聚集索引进行索引查找。但据我所知,它应该进行索引扫描,因为 99.99% 的数据满足选择查询中提到的过滤条件。

有人能告诉我为什么它在做索引搜索而不是索引扫描吗?

整个活动的目的是证明(正如我将要介绍的统计数据)SQL Server 在准备执行计划之前查看统计数据以识别符合查询过滤条件的记录数,并基于百分比记录匹配表中的总记录,它将决定执行扫描或搜索。如果匹配记录的百分比大约等于表中的记录总数,则应执行 SCAN。但这并没有发生。当我使用 AdventureWorks2016 数据库并运行以下查询时也是如此:

select * from [Sales].[SalesOrderHeader] WHERE SalesOrderID >= 43659 AND 
SalesOrderID <= 73659
Run Code Online (Sandbox Code Playgroud)

上面的查询返回 31465 条记录中的 30001 条。但它仍然在做聚集索引查找。

我变得非常困惑,它正在动摇我的概念。:( 可以请一些帮助。

PS:我也清理了计划缓存,但没有运气。SQL Server 版本是 2016。

Mar*_*ith 6

整个活动的目的是证明(正如我将要介绍的统计数据)SQL Server 在准备执行计划之前查看统计数据以识别符合查询过滤条件的记录数,并基于百分比记录匹配表中的总记录,它将决定执行扫描或搜索。如果匹配记录的百分比大约等于表中的记录总数,则应执行 SCAN。

这是不正确的,所以解释了为什么你没有看到它。该BETWEEN 43659 AND 73659范围内寻求做部分扫描。它只能使用 B 树来寻找开始扫描的点(因此避免读取任何低于 的值43659),并且如果存在值大于 的行,则可能提前退出73659

对于该行范围内,它只是读取网页,并跟随链表的下一个叶子页以完全相同的方式为索引扫描命令一样。

没有理由要在这里进行扫描。它充其量节省了一些逻辑读取,以便从根导航到叶子以找到起点,但代价是读取所寻求范围之外的其他行。


For*_*est 5

您的理解是错误的,我相信您将您的案例与引爆点问题混淆了,这是一个值得仔细阅读和理解的问题。

对于SQL Server,查找是一种使用 B 树开始或停止读取特定值行的操作。从理论上讲,您可以按照扫描的确切顺序对每一行进行搜索读取。

对于 Oracle 以及其他 RDMS,此操作(在定义的起始值和停止值处读取多行)称为范围扫描。

这是读取每一行的查找的快速演示

DROP TABLE IF EXISTS dbo.SeekTest
GO

CREATE TABLE dbo.SeekTest(
ID int PRIMARY KEY CLUSTERED,
filler char(8000) --to get 1 row per page
)

INSERT dbo.SeekTest (ID)
VALUES (1),(2),(3),(4),(5)
GO

SET STATISTICS IO ON

--this one scans
SELECT *
FROM dbo.SeekTest

--this one seeks
SELECT *
FROM dbo.SeekTest
WHERE ID > 0
Run Code Online (Sandbox Code Playgroud)

请记住,一个搜索可以读取多行。在这个演示中,它读取的数量与扫描的数量一样多。