标签: monitoring

排除进程列在“top”中

是否可以排除某些进程的报告top

例如,我想将其自身从其列表中排除(即,我不想top在进程列表中显示)。

我还希望能够排除不属于正在运行的用户的进程top(除了root)。

这可能吗?如果是这样,怎么办?如果没有,是否有类似的工具可以完成我想要的操作(不涉及ps频繁运行某些东西)。


-u我意识到您可以通过使用或选项调用来监视给定用户的进程-U,但这与仅监视运行top.

monitoring performance-monitoring top process

2
推荐指数
1
解决办法
2546
查看次数

Nagios 在服务恢复时不发送电子邮件?

我已经和厨师一起设置了 Nagios。它正在准确地监视事物。当服务/主机出现问题时,我会收到一封电子邮件和 jabber 消息,这正是我配置它的方式。

但是,当服务/主机恢复时,我什么也没得到。没有电子邮件或 jabber 消息。nagios 网站更新以显示服务/主机正常,我只是没有收到恢复电子邮件。我的 nagios 网站列出了它发送的通知,它们都是问题通知。那里没有任何恢复电子邮件的记录。

什么会导致这种情况?是否有不同的 nagios 设置recovery_notification_command

monitoring nagios

2
推荐指数
1
解决办法
3114
查看次数

运行远程脚本并在不保持连接的情况下监控他的活动

我自己在 Linux Mint 上工作,拥有具有 root ssh 访问权限的远程 Ubuntu VPS 服务器。我在服务器上脚本,可以进行长时间的数据处理(数小时或数天的处理)。

现在我可以在我的机器上打开控制台,通过 ssh 连接到 VPS 并运行脚本 - 我在我的控制台中实时查看脚本正在做什么(处理了多少数据,剩余多少等等在我的控制台屏幕上定期刷新) -这有效。

我怎么能做类似的,但不依赖我的本地机器

  1. 连接到服务器并运行脚本
  2. 断开连接并离开服务器来完成他的长时间处理工作,同时我可以重新启动本地机器或关闭它,而不会影响已启动的服务器脚本执行。
  3. 有可能稍后再次连接并查看进程的当前状态(它实时向我显示的相同数据)而不会中断进程。

monitoring ssh console

2
推荐指数
1
解决办法
1473
查看次数

ELB 侦听器上的多个证书。Nagios 监控只检查默认的,不管主机名

所以我有两个站点在运行,每个站点都在一个 Amazon ELB 后面。

出于这篇文章的目的(以及我公司的隐私),每个主机名都使用这些主机名:

  • 例子.com
  • 另一个例子.com

两者都安装了证书。两个证书都是可信的(从 CA 购买)。

它们通过浏览器/等完美运行,并且在请求站点时使用正确的证书(ELB 的预期行为)。已通过各种浏览器和请求确认在访问每个站点时正在加载和验证适当的证书。

但是,在尝试使用 Nagios 监控证书到期时,我发现了一个奇怪的问题。

证书监控有效,但仅适用于 ELB 中的默认证书,无论正在访问哪个主机。

这是命令定义,标准设置:

define command{
    command_name    check_cert_expire
    command_line    $USER1$/check_http -S -H $HOSTADDRESS$ -C $ARG1$
}
Run Code Online (Sandbox Code Playgroud)

然后在主机/服务定义中:

define host{
  host_name             example.com
  use                   docker-container
  display_name          Example Site 1
  check_command         check_https_page!/
}

define host{
  host_name             anotherexample.com
  use                   docker-container
  display_name          Example Site 2
  check_command         check_https_page!/
}


define service{
  host_name             example.com
  use                   generic-service
  service_description   Cert Expiry Site1
  check_command         check_cert_expire!45
}

define service{
  host_name             anotherexample.com
  use                   generic-service
  service_description …
Run Code Online (Sandbox Code Playgroud)

monitoring load-balancing nagios amazon-web-services amazon-elb

2
推荐指数
1
解决办法
297
查看次数

Android系统上如何获取CPU硬件ID?

我需要从中获取CPU电压和温度,/sys/class/hwmon但需要找到CPU ID才能找到正确的目录,例如:

$ ll /sys/class/hwmon/hwmon2/device
lrwxrwxrwx 1 root root 0 sep  3 13:05 /sys/class/hwmon/hwmon2/device -> ../../../0000:2f:00.0/
Run Code Online (Sandbox Code Playgroud)

如何查看是什么设备0000:2f:00.0?,我找到/sys/devices/cpu但找不到硬件id,lspci和lsusb无法显示CPU硬件。

这个想法是在 Ubuntu 或 Android 等 Linux 系统中无需非本机方法即可获取值。

monitoring central-processing-unit android devices

2
推荐指数
1
解决办法
1148
查看次数

通过我的路由器监控网站访问?

我有一个 SMC 路由器,我的 ISP 为我的家用电缆调制解调器提供了它。

是否有任何软件/硬件产品可用于监控家庭正在浏览的网站?

(具有阻止网址的能力)。

我们有 2 台无线连接到路由器的计算机。我想监控我孩子使用的另一台计算机。

monitoring internet

1
推荐指数
1
解决办法
1471
查看次数

Nagios 检查网站上的文件

我想创建一个 nagios 检查来测试某个文件是否在公共网站上可用,以及该文件是否包含某行文本。

从我一直在执行的命令行:

./check_http -H 192.168.1.2 -u http://192.168.1.2/index.html -t 5 -s "公司名称"

如果我删除文件或更改它正在查找的文本,则通过 OK 并失败。

现在我想把它合并到我的 nagios 配置文件中。

我创建了一个主机,它具有上面的 ip 地址,并创建一个服务,如下所示。

check_command check_http!-u /index.html -t 5 -s "公司名称"

但是,如果我更改了它正在检查的文件名或它正在检查的文本,即使我知道它们在网站上不存在,它仍然会通过。

我做错了什么我想我必须测试不同的文件或其他东西才能让它始终通过。

linux monitoring website nagios

1
推荐指数
1
解决办法
4015
查看次数

用于网络监控的 Linux“机器”——为 Windows 管理员简化

我浏览了一些相关的问题,但想更具体一些。

这是我希望的:

  • Linux 机器(VM,随便)
  • 运行可以执行系统日志记录和仪表板的应用程序
  • 从瞻博网络和其他非思科设备(使用 SNMP 或其他)获取信息
  • 提供实时图表和报告
  • 通知支持/故障排除
  • 网页界面
  • 全部开源或免费

现在的注意事项。我知道 NAGIOS、Groundworks 和 Zenoss ......过去甚至尝试过与他们打交道。 问题是我是 Windows 管理员,Linux 经验非常有限。因此,当涉及到交钥匙或演练以外的任何事情时,它很快就会开始变得冒险。 我最终放弃了它们,因为学习曲线太大了,尤其是当您不太了解 Linux 命令以进行故障排除和正确配置时。

那么任何人都可以推荐一个快速简单的解决方案,让我开始并继续上述(记住注意事项)?

networking linux monitoring

1
推荐指数
1
解决办法
783
查看次数

以编程方式监视 SQL Server 2005 镜像

SQL Server 2005 是否提供了一个可以通过编程来确定镜像数据库运行状况的接口?

如果是这样,有没有人有如何这样做的例子?

monitoring database-mirroring sql-server sql-server-2005

1
推荐指数
1
解决办法
297
查看次数

有没有开源的简单网络监控应用程序?

我正在调试我们的一个系统的问题。每个星期天,它都会停止与另一台服务器的通信。如果我们重新启动两台服务器,通信将再次工作。

我想知道是否有任何小型应用程序可以监控 TCP 端口可用性和网络连接,可能会记录任何停机时间。如果可能的话,我也希望它是开源的,但如果有另一个专有的解决方案,我也想听听。

networking windows monitoring

1
推荐指数
1
解决办法
884
查看次数