什么是数据库统计信息，我如何从中受益？

Question

什么是数据库统计信息，我如何从中受益？

gor*_*ric 18 sql-server-2005 statistics

我听说过 SQL Server 默认保留的统计信息。他们在跟踪什么，我如何使用这些信息来改进我的数据库？

Answer 1

统计只是一种动态元数据形式，可帮助查询优化器做出更好的决策。例如，如果表中只有十多行，那么去索引进行查找是没有意义的；进行全表扫描总是会更好。但是如果同一个表增长到一百万行，那么使用索引可能会更好。但是，如果您在只有很少唯一值的列上查询该表（例如，它可能是仅包含“M”或“F”的“性别”列），那么实际上 FTS 可能会更好，因为您会无论如何都需要检索块以构建结果集。现在假设您的表是 99% 的“M”而只有 1% 的“F”，我们应该在一种情况下使用 FTS 或在另一种情况下使用索引。同一个表，同一个查询，可能有四种不同的查询计划，具体取决于表的内容。这些东西就是“统计数据”，它们对每个数据库都是独立的——即使两个具有相同表和索引结构的数据库也会有不同的统计数据。

总之，在现代数据库引擎中有两种查询优化：重写 SQL（基于规则的优化，就像编译器重写您的 C 以使其更高效）和选择正确的数据路径（基于成本的优化），就像在运行时识别热点的 JIT 编译器一样）。如果您发现查询优化器做了明显错误的事情（例如，当您知道索引会更好时选择 FTS），您只需要担心这一点。

+1 我再好不过了。重要的是要记住，统计数据只有在保持最新状态时才有用。这可以通过自动更新统计信息或定期（每晚/每周）更新统计信息命令来完成。此外，索引重建将自动执行统计更新。 (2认同)

Answer 2

gbn*_*gbn 5

它们使用的查询优化器（白皮书MSDN上）来跟踪在索引和/或列中的值的分布。

你唯一关心的应该是定期更新：让数据库引擎去做它的事情

不总是。有时手动创建统计信息有助于提高查询性能。 (2认同)
我做过几次，但不经常。我反对你的“你唯一关心的应该是定期更新”的声明，因为更新统计数据并不是唯一的事情。 (2认同)

归档时间：	15 年，5 月前
查看次数：	36724 次
最近记录：	12 年，9 月前