PostgreSQL 检查点日志解释

Question

PostgreSQL 检查点日志解释

ini*_*ff1 5 postgresql checkpoint log write-ahead-logging

我知道 PostgreSQL 检查点是什么以及它何时发生。

我需要一些有关log_checkpoints = on参数生成的日志的附加信息，因此请向我解释其中的一些要点：

2017-09-09 16:31:37 EEST [6428-6524] LOG: checkpoint complete: wrote 30057 buffers (22.9%); 0 transaction log file(s) added, 0 removed, 47 recycled; write=148.465 s, sync=34.339 s, total=182.814 s; sync files=159, longest=16.143 s, average=0.215 s

我知道 22.9% 的共享缓冲区被写入（我有 1024 MB，shared_buffers所以这意味着 234 MB 被写出）。
我知道有 47 个 WAL 文件被回收，即崩溃恢复不再需要它们，因为来自它们的真实数据已经在磁盘上。

质疑。但是write=148.465 s和sync=34.339呢？有什么不同？什么是write，为什么它的时间远远超过fsync()操作？

问题B。什么是sync files？哪些文件：WAL 文件？为什么sync files是159个，而回收的文件只有47个？它们之间有什么关系？

谢谢！

Answer 1

mus*_*cio 5

对于你的问题A：“写入”和“同步”的意思正是他们所说的；它是从 Postgres 缓冲池中一系列缓冲（如文件系统 I/O 缓冲区）写入脏页的序列，然后fsync()（通常）确保文件系统缓冲区实际上已写入磁盘。写入会受到限制并在后台发生，因此可能需要更长的时间。

对于你的问题B：sync files告诉你有多少操作系统文件受到检查点的影响。由于每个表和索引都存储在自己的文件中，因此该数字可以让您了解有多少数据库对象受到检查点的影响。当 WAL 缓冲区被刷新时，即在检查点之前，WAL 被同步；这就是为什么它被称为“预写”。

Answer 2

jja*_*nes 5

写入和同步阶段意味着相当不同的事情（不幸的是）。在检查点的中间阶段，它从共享缓冲区中写出所有脏缓冲区。它以一种节流的方式执行此操作，主要由 checkpoint_completion_target 调节。此处报告的时间是写入这些缓冲区所花费的时间，以及为调节写入缓冲区的速率所花费的睡眠时间。所以并不是所有的“写作”时间都花在积极写作上。在写入阶段花费的时间长度，2.5 分钟，在不知道您的其他设置是什么的情况下并没有真正的意义。

在同步阶段，它同步所有刚刚写入的文件（以及其他进程可能写入的任何数据文件）。这个阶段是不受限制的，它会尽可能快地同步它们。这需要 34 秒，其中一个文件需要 16.143 秒，这表明您的 IO 硬件无法满足您投入的工作负载。

159个同步文件是指自上次检查点结束后被弄脏的数据文件数，因此需要在本次检查点结束前同步。47 指的是 WAL 文件，而不是数据文件。WAL 文件包含对数据文件所做更改的引用。47 个 WAL 文件很容易包含 159 个数据文件（或就此而言，15,900 个数据文件）的引用。但事情并没有那么简单，因为被回收的WAL文件都是之前两个checkpoint的文件，所以47和159的关系只是一个类比，不是具体的计数。

归档时间：	8 年，2 月前
查看次数：	4744 次
最近记录：	8 年，1 月前