什么是数据库统计信息,我如何从中受益?

gor*_*ric 18 sql-server-2005 statistics

我听说过 SQL Server 默认保留的统计信息。他们在跟踪什么,我如何使用这些信息来改进我的数据库?

Gai*_*ius 21

统计只是一种动态元数据形式,可帮助查询优化器做出更好的决策。例如,如果表中只有十多行,那么去索引进行查找是没有意义的;进行全表扫描总是会更好。但是如果同一个表增长到一百万行,那么使用索引可能会更好。但是,如果您在只有很少唯一值的列上查询该表(例如,它可能是仅包含“M”或“F”的“性别”列),那么实际上 FTS 可能会更好,因为您会无论如何都需要检索块以构建结果集。现在假设您的表是 99% 的“M”而只有 1% 的“F”,我们应该在一种情况下使用 FTS 或在另一种情况下使用索引。同一个表,同一个查询,可能有四种不同的查询计划,具体取决于表的内容。这些东西就是“统计数据”,它们对每个数据库都是独立的——即使两个具有相同表和索引结构的数据库也会有不同的统计数据。

总之,在现代数据库引擎中有两种查询优化:重写 SQL(基于规则的优化,就像编译器重写您的 C 以使其更高效)和选择正确的数据路径(基于成本的优化) ,就像在运行时识别热点的 JIT 编译器一样)。如果您发现查询优化器做了明显错误的事情(例如,当您知道索引会更好时选择 FTS),您只需要担心这一点。

  • +1 我再好不过了。重要的是要记住,统计数据只有在保持最新状态时才有用。这可以通过自动更新统计信息或定期(每晚/每周)更新统计信息命令来完成。此外,索引重建将自动执行统计更新。 (2认同)

gbn*_*gbn 5

它们使用的查询优化器(白皮书MSDN上)来跟踪在索引和/或列中的值的分布。

唯一关心的应该是定期更新:让数据库引擎去做它的事情

  • 不总是。有时手动创建统计信息有助于提高查询性能。 (2认同)
  • 我做过几次,但不经常。我反对你的“你唯一关心的应该是定期更新”的声明,因为更新统计数据并不是唯一的事情。 (2认同)