Ant*_*son 6 linux docker rancher manjaro
我很久以前就已经将我的 docker 主机添加到 Rancher 中,几个月来一切都运行良好。突然,几天前,我的 docker 主机在 Rancher 中被标记为“已断开连接”。当我检查 rancher-agent 容器的状态时,我可以看到它一直在重新启动:
\n\xe2\x80\xa2100% \xe2\x9e\x9c sudo docker ps -f name=rancher\nCONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES\n0a12a18ca52c rancher/agent:v1.2.11 "/run.sh run" 21 hours ago Restarting (1) 54 seconds ago rancher-agent\nRun Code Online (Sandbox Code Playgroud)\n在日志中我看到这个:
\n\xe2\x80\xa2100% \xe2\x9e\x9c sudo docker container logs 0a12a18ca52c \ntime="2021-06-29T09:13:27Z" level=fatal msg="Failed to find container id:\\n0::/\\n" \ntime="2021-06-29T09:13:28Z" level=fatal msg="Failed to find container id:\\n0::/\\n" \ntime="2021-06-29T09:13:29Z" level=fatal msg="Failed to find container id:\\n0::/\\n" \ntime="2021-06-29T09:13:31Z" level=fatal msg="Failed to find container id:\\n0::/\\n" \ntime="2021-06-29T09:13:32Z" level=fatal msg="Failed to find container id:\\n0::/\\n" \ntime="2021-06-29T09:13:35Z" level=fatal msg="Failed to find container id:\\n0::/\\n" \ntime="2021-06-29T09:13:39Z" level=fatal msg="Failed to find container id:\\n0::/\\n" \nRun Code Online (Sandbox Code Playgroud)\n我尝试在网上搜索此内容,但没有发现任何有趣的内容。我尝试过重新创建容器。我尝试删除所有内容/var/lib/rancher并重新创建容器。我什至尝试删除Rancher中的环境,停止docker,删除docker主机上的所有docker数据(data-root),再次删除与rancher-agent相关的文件并重新创建rancher-agent。每次我重新创建 rancher-agent 时,我都会使用 Rancher GUI 在您想要添加新主机时为您提供的命令。我总是在日志中遇到相同的错误。
我在主机上安装的 docker 版本与主机上次连接到 Rancher 时的版本相同。我在运行 Manjaro 的机器上使用 Rancher 1.6(无法更改)和 docker 20.10.6(也尝试过 20.10.7)。
\n这是由 cgroups v2 引起的,使其再次工作
echo 'GRUB_CMDLINE_LINUX=systemd.unified_cgroup_hierarchy=false' > /etc/default/grub.d/cgroup.cfg
update-grub
Run Code Online (Sandbox Code Playgroud)
TL;DR:我用 Ubuntu 20.04 重新安装了 dockerhost,现在一切正常。
我尝试设置一个新的虚拟机,其操作系统与我的主机相同(Manjaro Linux),我得到了与主机上完全相同的体验和行为。我的 dockerhost 已“断开连接”,日志显示“无法找到容器 id:...”。我用 Ubuntu 20.04 创建了另一个虚拟机,一切都按预期工作。奇怪的是docker版本是一样的。但不确定containerd。我确实在主机和来宾上尝试了 docker 和 containerd 的不同组合,但它们总是遇到相同的问题。