由于系统中打开的文件太多,Kubernetes 无法启动

Bob*_*Bob 0 linux containers docker kubernetes devops

我正在尝试使用 Kubernetes 创建一堆 Pod、服务和部署,但是在我运行kubectl describe命令时不断遇到以下错误。

for "POD" with RunContainerError: "runContainer: API error (500): Cannot start container bbdb58770a848733bf7130b1b230d809fcec3062b2b16748c5e4a8b12cc0533a: [8] System error: too many open files in system\n"

我已经终止了所有 pod 并尝试重新启动机器,但它并没有解决问题。我不是 Linux 专家,所以我只是想知道如何找到所有打开的文件并关闭它们?

CJ *_*len 6

您可以通过运行以下命令来确认哪个进程正在占用文件描述符:

lsof | awk '{print $2}' | sort | uniq -c | sort -n
Run Code Online (Sandbox Code Playgroud)

这将为您提供带有进程 pid 的打开 FD 计数的排序列表。然后你可以查找每个进程 w/

ps -p <pid>
Run Code Online (Sandbox Code Playgroud)

如果主要的猪是 docker/kubernetes,那么我建议关注caesarxuchao 引用的问题