Docker 守护进程无法处理日志

Mys*_*yos 7 logging debian json daemon docker

Docker 守护进程无法解析 json 日志并抛出unexpected EOF错误。我们正在调查问题的根本原因。

环境:

  • Debian 4.9.189-3+deb9u2
  • Docker 引擎 19.03.5

Docker 守护进程日志:

Apr 29 14:31:05 Prod-IS dockerd[30810]: time="2020-04-29T14:31:05.070677515+02:00" level=warning msg="got error while decoding json" error="unexpected EOF" retries=345
Apr 29 14:31:05 Prod-IS dockerd[30810]: time="2020-04-29T14:31:05.070695689+02:00" level=warning msg="got error while decoding json" error="unexpected EOF" retries=346
Apr 29 14:31:05 Prod-IS dockerd[30810]: time="2020-04-29T14:31:05.070712630+02:00" level=warning msg="got error while decoding json" error="unexpected EOF" retries=347
Apr 29 14:31:05 Prod-IS dockerd[30810]: time="2020-04-29T14:31:05.070732299+02:00" level=warning msg="got error while decoding json" error="unexpected EOF" retries=348
Apr 29 14:31:05 Prod-IS dockerd[30810]: time="2020-04-29T14:31:05.070755016+02:00" level=warning msg="got error while decoding json" error="unexpected EOF" retries=349
Apr 29 14:31:05 Prod-IS dockerd[30810]: time="2020-04-29T14:31:05.070773699+02:00" level=warning msg="got error while decoding json" error="unexpected EOF" retries=350
Run Code Online (Sandbox Code Playgroud)

Docker 守护进程配置

"log-driver": "json-file",
"log-opts": {
  "mode": "non-blocking",
  "max-size": "500m",
  "max-file": "3"
}
Run Code Online (Sandbox Code Playgroud)

docker 写入日志的分区上有可用的存储空间。

非常欢迎您对此事的见解。

Mys*_*yos 7

上述问题将导致 docker(版本 <= 19)进程的 CPU 使用率出现异常峰值,并持续保持在该水平,直到您修复日志。

要修复日志和 CPU 使用情况,您必须截断所有容器日志(因为我们无法确定哪个容器有错误日志)。仅当您的日志采用 json 格式时它才有效:

truncate -s 0 /var/lib/docker/containers/*/*-json.log
Run Code Online (Sandbox Code Playgroud)

请参阅安德烈的答案以获得永久修复。


And*_*gel 5

Issue=Docker 引擎错误 json-file:修复偶发的意外 EOF 错误

我花了一些时间研究并尝试在 docker 日志中查找错误。

docker 引擎 20.10.5 是在 docker 中运行的版本,存在一个错误。Github PR 解决了这个问题。https://github.com/moby/moby/pull/42104

我在运行时发现错误

$ journalctl -u docker.service
level=warning msg="got error while decoding json" error="unexpected EOF" retries=19999
Run Code Online (Sandbox Code Playgroud)

用于日志的 Docker 驱动程序有一个错误,它无法处理某些日志格式。然后,该错误会用重试消息淹没系统日志。这种情况会产生非常烦人的 CPU 负载。

Docker 引擎最新版本为 20.10.7。该问题已在 Docker 引擎 20.10.6 版本中修复https://docs.docker.com/engine/release-notes/#20106