为什么count(*)在一个PostgreSQL数据库中占用的时间非常长,而另一个则不然?

Ste*_*hen 5 postgresql count

我有两个Postgres数据库.在一个我有两个表,每个表有大约8,000,000行,并且其中任何一个的计数大约需要一秒钟.在另一个数据库中,也是Postgres,有些表是1,000,000行,计数需要10秒,一个表大约有6,000,000行,计数需要3分钟才能运行.哪些因素决定了这需要多长时间?它们位于不同的计算机上,但需要更长时间的数据库位于更快的计算机上.

我已经读过一般来说postgres计数是如何缓慢的,但这对我来说似乎很奇怪.我无法真正使用解决方法,因为我正在使用django,它在管理中进行了计数,这将永远耗尽并使其难以使用.

任何有关此信息都会有所帮助.

Mar*_*ers 4

计数速度不仅取决于表中的行数,还取决于从磁盘读取数据所需的时间。时间取决于很多因素:

  • 表中的行数 - 正如您已经提到的。
  • 每页的记录数(如果每条记录占用更多空间,则需要读取更多页才能读取相同的行数)。
  • 如果页面仅部分满,则您必须阅读更多页面。
  • 如果表已缓存在内存中(拥有更多可用内存会有所帮助)。
  • 如果表是用小索引建立索引的(可以用计数索引代替)。
  • 硬件差异。
  • ETC....