gor*_*ric 18 sql-server-2005 statistics
我听说过 SQL Server 默认保留的统计信息。他们在跟踪什么,我如何使用这些信息来改进我的数据库?
Gai*_*ius 21
统计只是一种动态元数据形式,可帮助查询优化器做出更好的决策。例如,如果表中只有十多行,那么去索引进行查找是没有意义的;进行全表扫描总是会更好。但是如果同一个表增长到一百万行,那么使用索引可能会更好。但是,如果您在只有很少唯一值的列上查询该表(例如,它可能是仅包含“M”或“F”的“性别”列),那么实际上 FTS 可能会更好,因为您会无论如何都需要检索块以构建结果集。现在假设您的表是 99% 的“M”而只有 1% 的“F”,我们应该在一种情况下使用 FTS 或在另一种情况下使用索引。同一个表,同一个查询,可能有四种不同的查询计划,具体取决于表的内容。这些东西就是“统计数据”,它们对每个数据库都是独立的——即使两个具有相同表和索引结构的数据库也会有不同的统计数据。
总之,在现代数据库引擎中有两种查询优化:重写 SQL(基于规则的优化,就像编译器重写您的 C 以使其更高效)和选择正确的数据路径(基于成本的优化) ,就像在运行时识别热点的 JIT 编译器一样)。如果您发现查询优化器做了明显错误的事情(例如,当您知道索引会更好时选择 FTS),您只需要担心这一点。