如何有效地对 Postgres 中的表进行真空分析

Ram*_*nan 6 sql postgresql vacuum

我在 postgres 上运行了一个巨大的查询,其中一个连接表总是进行顺序扫描。列上的索引存在,而 postgres 没有使用它。我做了一个真空分析,然后 postgres 查询计划立即更改为进行索引扫描。

我的问题是进行真空分析的最有效方法是什么。它锁定表吗?如果是这样,您如何真空分析实时生产表?

ome*_*ooq 24

“真空分析”实际上执行两个完全不同的任务。

  1. 真空用于释放死元组/行占用的空间。
  2. 分析用于分析表的内容,从而帮助规划器创建更好的查询计划。

“真空分析”是手动清理操作,通常每周或每月执行一次,具体取决于对数据库执行更新/删除的频率。该操作可以针对特定表执行,也可以针对整个数据库执行。这需要 30 分钟到甚至几天的时间,具体取决于数据库的大小以及执行此操作的频率。

何时使用 VACUUM FULL 和 ANALYZE:

如果您的数据库占用了太多空间,并且操作系统没有剩余空间来执行任何其他操作,那么您需要执行 VACUUM FULL,还建议向其添加 ANALYZE 选项。如果您的数据库写入频率较高,那么我建议至少每 3-6 个月执行一次此操作。

VACUUM(FULL, ANALYZE, VERBOSE);
Run Code Online (Sandbox Code Playgroud)

如果您无法锁定整个数据库,而您只需要释放执行大量更新/删除的表所占用的空间。然后在特定表上执行 VACUUM FULL

VACUUM FULL VERBOSE your_table_name;
Run Code Online (Sandbox Code Playgroud)

如果您遇到问题,您的查询随着时间的推移变得更慢,即如果您对查询运行 EXPLAIN,有时它使用顺序扫描,而具有不同参数的相同查询使用索引扫描。那么这意味着你的表没有被完全分析。可以对整个数据库或特定表进行分析。在此操作期间数据库或表不会被锁定,并且在此操作之后您的查询将执行得更好。

ANALYZE VERBOSE your_table_name
Run Code Online (Sandbox Code Playgroud)

自动分析:

尽管您可能永远不需要手动分析数据库,因为这是由自动分析守护进程自动完成的,该守护进程在后台运行并分析超过特定更新/删除阈值的表,默认情况下为表大小的 10%。但在大型表上,这个阈值永远不会达到,即使达到 5% 的阈值,查询也会变慢。因此,ANALYZE 应与 VACUUM FULL 一起定期手动执行。

自动真空:

Auto Vacuum 是另一个守护进程,它在后台和 Vacuum 表中运行,而不锁定它们。自动真空还可以运行自动分析,因此自动真空也会自动分析表。自动清理对表执行操作所需满足的条件默认设置为表大小的更新/删除的 20%。

例子:

对于一个包含 4000 万行的表,当表收到 800 万次更新或删除时,自动清理将运行。同样,该表需要接收 400 万次更新或删除才能开始自动分析。大多数情况下,这种大小的表在收到此阈值之前会变得很慢,因此建议定期手动进行 VACUUM FULL ANALYZE。

  • 对于全真空,请注意,它将需要额外的磁盘空间。因此,如果磁盘上没有剩余空间,那么在发出 FULL VACUUME 之前首先需要一些可用空间。 (2认同)

小智 6

您可以只运行分析,也不需要运行真空。语法将是:

ANALYZE [ VERBOSE ] [ table_name [ ( column_name [, ...] ) ] ]
Run Code Online (Sandbox Code Playgroud)

在文档中它指出:

ANALYZE requires only a read lock on the target table, so it can run in parallel with other activity on the table.
Run Code Online (Sandbox Code Playgroud)

您可以在这里找到更多信息:

http://www.postgresql.org/docs/9.4/static/sql-analyze.html

https://wiki.postgresql.org/wiki/Introduction_to_VACUUM,_ANALYZE,_EXPLAIN,_and_COUNT

真空分析锁表吗?

不,它是锁定表的“FULL VACUUM”命令。