Aru*_*ath 5 sql-server statistics sql-server-2014
根据 MS 文档,其描述AVG_RANGE_ROWS是:
直方图步骤中具有重复列值的平均行数,不包括上限。当 DISTINCT_RANGE_ROWS 大于 0 时,通过将 RANGE_ROWS 除以 DISTINCT_RANGE_ROWS 来计算 AVG_RANGE_ROWS。当 DISTINCT_RANGE_ROWS 为 0 时,AVG_RANGE_ROWS 为直方图步骤返回 1。
我期待在最后一行,如果的确是这样,我很好奇,想知道为什么我看到一个值AVG_RANGE_ROWS是不相等1的时候DISTINCT_RANGE_ROWS是0在直方图步骤。
有问题的统计信息是 SQL Server 在启用自动创建统计信息选项时创建的列统计信息。我使用的是旧版本的数据库,但使用的是最新补丁 - SQL Server 2014 SP3、CU4+GDR (12.0.6372.1)。
有点不幸的是,由于次优查询计划,我们上周几乎崩溃了。最终结果是大扫描和膨胀的内存授权。使用更高的百分比值重新采样统计数据暂时为我们解决了这个问题,但我很想知道初始语句或已知问题是否存在异常(可能使用跟踪标志解决?)以及如何解决对于我们无法控制采样大小的自动创建的统计数据,我如何防止这种情况再次发生?
如对格式错误的直方图导致对嵌套循环的错误估计的回答中所述,计算和存储采样统计数据的方式发生了变化,尤其是在应用缩放时。
作为副作用,DISTINCT_RANGE_ROWS您的情况下的值是介于 0 和 1 之间的分数 (980.235 / 386212.6 = 0.002538071)。该列的公开类型为bigint,因此它向下舍入为零。
显然,当范围包含非零行数时,实际上不可能有零个不同的值。
人们只能希望在某个阶段消除这些差异;尽管很难想象如果没有数据类型的潜在破坏性更改,它会是什么样子,也扩展到sys.dm_db_stats_histogram(在 SQL Server 2016 及更高版本上可用)。
至于您如何处理,如果您确信这不仅仅是一个显示问题并且实际上导致了糟糕的估计,您应该将其报告为回归。