Error: failed to start container "node-exporter": Error response from daemon: path /sys is mounted on /sys but it is not a shared or slave mount
Run Code Online (Sandbox Code Playgroud)
显示此处的消息是存储库,我从尝试通过 Kubernetes pod 将节点导出器创建到 Grafana 仪表板中获取了此视频和此存储库
错误截图

docker grafana kubernetes prometheus prometheus-node-exporter
我有 3 个节点在单独的 Docker 容器中运行,我想使用 Prometheus 监控它们。我已经部署了带有 Prometheus 服务器的 docker 容器,但需要在容器中安装节点导出器以将指标导出到服务器。这些容器是使用 Ubuntu 映像构建的,并且在每个容器中运行一个 .jar。
我在 AWS EKS 中将节点导出器作为守护程序集运行,今天发现它存在于 10 个节点上,但我的集群有 13 个节点。
如何确保它也在 3 个丢失的节点上运行?
我正在关注这篇有关使用文本文件收集器导出指标的文章。
我制作了一个/var/lib/node_exporter/textfile_collector/directory_size.prom包含目录大小指标的文本文件,但它不会将其推送到普罗米修斯。
我读到该标志--collector.textfile.directory负责读取目录的路径。如何查看收集器的目录是什么,以及如何更改它?
我是node_exporter这样开始的
cd /exporter
Run Code Online (Sandbox Code Playgroud)
然后
./node_exporter &
Run Code Online (Sandbox Code Playgroud)
我尝试node_exporter使用模块运行 Ansibleshell但没有成功
- name: Run Exporter
become: yes
ansible.builtin.shell: " ./node_exporter & "
args:
chdir: /home/netmera/exporter/
Run Code Online (Sandbox Code Playgroud)
任何帮助,将不胜感激。
我试图限制 node_exporter 正在收集指标的 systemd 单元,但我在正则表达式方面遇到了问题。我使用 grafana-server.service 作为主机上的测试,但当我引入正则表达式时,导出器没有报告任何指标。我尝试了多种格式,但无法弄清楚,这是我目前正在尝试 atm 的格式:
ExecStart=/opt/node_exporter/node_exporter --collector.systemd.unit-include "(grafana|ssh)\.service" --collector.filesystem.ignored-mount-points "^/(sys|proc|dev|run|boot|host|etc)($|/)" $ARGS
顺便说一句,文件系统收集器正则表达式正在工作。有知道我搞砸了什么的线索吗?
谢谢
我已经使用 prometheus 设置了一个监控系统,带有 AWS EC2 自动发现和节点导出器。使用以下公式获取 CPU 利用率:
100 - (avg by (instance) (irate(node_cpu_seconds_total{instance="instancexyz" ,mode="idle"}[5m])) * 100)
但是,在一个特定的 ASG 中,我得到的 CPU 百分比为大的负值。我打开了 instance:9100/metrics 链接,发现空闲值是大指数值。这是我得到的一个值:
node_cpu_seconds_total{cpu="0",mode="idle"} 4.25766215e+06
除了少数实例外,这些指标在我的所有实例上都运行良好。知道发生了什么吗?