标签: monitoring

达到 nginx 状态时绕过本地主机上的 SSL

我有一个位置/nginx_status,我昨晚安装了一个 SSL 证书。

server {
    listen 443;
    ...
    location /nginx_status {
        stub_status on;
        access_log off;
        allow 127.0.0.1;
        deny all;
    }
}
Run Code Online (Sandbox Code Playgroud)

当它仍然在端口 80 上时,这是在进行证书前安装。现在,我已经进行了重定向以将 www.domain.tld 和 domain.tld 流量重定向到 https,例如

server {
        listen 80;
        server_name domain.tld;
        return 301 https://domain.tld$request_uri;
}

server {
        listen 80;
        server_name www.domain.tld;
        return 301 https://domain.tld$request_uri;
}
Run Code Online (Sandbox Code Playgroud)

我正在使用 graphdat-relay 来监视 nginx 统计信息,现在curl http://127.0.0.1/nginx_status 只获取重定向页面,例如

<html>
<head><title>301 Moved Permanently</title></head>
<body bgcolor="white">
<center><h1>301 Moved Permanently</h1></center>
<hr><center>nginx/1.6.2</center>
</body>
</html>
Run Code Online (Sandbox Code Playgroud)

我如何告诉 nginx 绕过 SSL 并仅在本地允许 /nginx_status ?

ubuntu monitoring nginx ubuntu-12.10

3
推荐指数
1
解决办法
2706
查看次数

使用外部 eSATA RAID5 SATA 端口倍增器时如何监控 RAID 状态?

我正在使用一个外部 eSATA 设备,它需要 5 个 SATA 驱动器并将它们作为一个大型硬件 RAID5 呈现给 linux (ubuntu)。

它使用 SiI3726 芯片组。

Linux 可以很好地查看和处理 sata 设备,但我想知道是否有任何方法可以查询/监控隐藏在此硬件 RAID 后面的 RAID5 状态。

(来自 dmesg - 我发誓我没有 16T 单驱动器......)

[   16.409678] sd 4:0:0:0: [sde] 31255691264 512-byte logical blocks: (16.0 TB/14.5 TiB)
[   16.409727] sd 4:0:0:0: [sde] Write Protect is off
[   16.409730] sd 4:0:0:0: [sde] Mode Sense: 00 3a 00 00
[   16.409752] sd 4:0:0:0: [sde] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
[   16.463573]  sde: sde1 …
Run Code Online (Sandbox Code Playgroud)

linux raid monitoring esata

3
推荐指数
1
解决办法
1910
查看次数

Monit 忽略内存使用阈值配置

我从 Ubuntu 存储库安装了 Monit 5.6,以提醒我 VPS 上异常高的内存和 CPU 使用率。事实证明,75% 的内存使用率对于我的设置来说很常见,所以我更改了在 file 中设置限制的行/etc/monit/conf.d/system.conf

check system localhost
  ...
  if memory usage > 90% then alert
Run Code Online (Sandbox Code Playgroud)

但现在它会在 75% 阈值和 90% 时提醒我。我搜索了其他地方可以设置它:grep 75% -r /etc/monit/,但没有匹配。Monit 在默认设置中是否还有其他地方存储其配置文件?还是 75% 的限制是以某种方式硬编码在其中的?我怎样才能禁用它?

UPD:我尝试在更改后重新加载和重新启动 monit(虽然没有尝试重新启动服务器)。我的 Monit 版本是:

# monit -V
This is Monit version 5.6
Copyright (C) 2001-2013 Tildeslash Ltd. All Rights Reserved.
Run Code Online (Sandbox Code Playgroud)

和配置文件:

check system localhost
  if loadavg (1min) > 4 then alert
  if loadavg (5min) > 3 then alert
  if memory usage …
Run Code Online (Sandbox Code Playgroud)

monitoring monit

3
推荐指数
1
解决办法
1240
查看次数

使用 Nagios 监控 Windows 页面文件

我有一个 NAGIOS 检查来监控 Windows 机器上的虚拟内存,这个检查返回所有使用的虚拟内存(物理+页面文件的最大大小)。

这不是我想要的,我试图搜索一些只监视 Windows 机器上页面文件使用情况的检查,但我没有找到任何有趣的东西。

您是否知道任何监控页面文件是否被 Windows 使用的 SNMP 检查?

windows monitoring nagios pagefile

3
推荐指数
1
解决办法
5162
查看次数

Icinga2:在主机/服务关闭时发送电子邮件

我用 icingaweb2 安装并配置了 Icinga2。

我添加了一个带有测试服务的测试主机:我们称之为“example.com”。

这是测试主机:

/etc/icinga2/conf.d/hosts/example-com:

object Host "example-com" {
        //Importiert die generische Host-Vorlage aus der template.conf
        import "generic-host"
        //IPv4 Adresse
        address = "2xx.2xx.2xx.2xx"

        //Angabe des Betriebssystemtyps
        vars.os = "Linux OS"
        vars.sla = "24x7"
}
Run Code Online (Sandbox Code Playgroud)

好的,那么我们有了服务配置:

/etc/icinga2/conf.d/hosts/example-com/http.conf

object Service "http" {
    import "generic-service"
    host_name = "example-com"
    check_command = "http"
    vars.sla = "24x7"
}
Run Code Online (Sandbox Code Playgroud)

当然我在/etc/icinga2/conf.d/users.conf中添加了一个新的用户组

/**
 * The example user 'icingaadmin' and the example
 * group 'icingaadmins'.
 */

object User "icingaadmin" {
  import "generic-user"

  display_name = "Icinga 2 Admin"
  groups …
Run Code Online (Sandbox Code Playgroud)

monitoring icinga icinga2

3
推荐指数
1
解决办法
3万
查看次数

如何在午夜设置 icinga2 停机时间

我们的备份在 22:00 到第二天大约 05:00 之间运行。我无法弄清楚如何在 icinga2(opensuse 42.1 上的 r2.4.1-1)中使用“apply ScheduledDowntime”在预定停机时间内设置它。

只是设置 22:00-05:00 给我一个错误:

无效的时间范围定义“22:00-05:00”:时间段在开始之前结束

当前机制使用一个服务变量backup_downtime,当它不为空时又会触发“apply”规则:

apply ScheduledDowntime "backup-downtime" to Service {
  author = "icingaadmin"
  comment = "Scheduled downtime for backup"

  ranges = {
    monday = service.vars.backup_downtime
    tuesday = service.vars.backup_downtime
    wednesday = service.vars.backup_downtime
    thursday = service.vars.backup_downtime
    friday = service.vars.backup_downtime
    saturday = service.vars.backup_downtime
    sunday = service.vars.backup_downtime
  }

  assign where service.vars.backup_downtime != ""
}
Run Code Online (Sandbox Code Playgroud)

有人有想法吗?谢谢

linux backup monitoring icinga

3
推荐指数
1
解决办法
3386
查看次数

Sensu API 没有响应。内轮:连接错误。Sensu API 是否正在运行?Redis问题

我一直在按照官方文档一遍又一遍地在 CentOS7.2 上设置 sensu 但是我一直无法让它工作:

我似乎无法连接到 API。Uchiwa 给出了错误:

ALERT
Datacenter site1 returned:
Connection error. Is the Sensu API running?`
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

我试过:curl -I http://localhost:4567/clients ...我没有得到回应。

这是/var/log/sensu/sensu-api.log http://pastebin.com/wHEHE0bH

我一直在创建一个脚本以使设置可重复。请参阅下面显示我的配置 的脚本:http : //pastebin.com/QEt5Msku 如果您在 CentOS7 上运行该脚本,它应该会重复这个问题。

使固定:

问题在下面的回答中。在遵循在新 VM 上成功安装 sensu 的非官方指南之后,我比较了两个设置步骤,并在新 VM 上进行了几次构建后,一点一点地交换了步骤,我想出了用非官方指南中的一个替换 repo指向一个稍微不同的 URL 修复了我的问题(CentOS6 的 repo 但它适用于 7,它只安装了一个非当前版本 0.20.3)。

echo '[sensu]
name=sensu-main
baseurl=http://repos.sensuapp.org/yum/el/6/x86_64/
gpgcheck=0
enabled=1' > /etc/yum.repos.d/sensu.repo
Run Code Online (Sandbox Code Playgroud)

monitoring rabbitmq redis sensu centos7

3
推荐指数
1
解决办法
3908
查看次数

/proc/diskstats: 没有那个文件或目录

尝试获取一些磁盘性能指标(特别是使用 munin),发现 /proc/diskstats不存在。

尝试过,yum provides '*/diskstats'但除了 munin 什么都没找到。

CentOS 6.7 版(最终版)

uname -a
Linux domain.com 2.6.32-042stab112.15 #1 SMP Tue Oct 20 17:22:56 MSK 2015 x86_64 x86_64 x86_64 GNU/Linux
Run Code Online (Sandbox Code Playgroud)

那么,我该如何解决呢?

monitoring performance drive statistics proc

3
推荐指数
1
解决办法
1529
查看次数

理解谷歌 SRE 书中的一个例子

我目前正在阅读谷歌的 SRE 书,这是一本非常有趣的书。

在第 6 章 - 监控分布式系统中,有一节解释了如何选择合适的度量。

我不明白作者在解释测量粒度很重要时给出的例子。我们可以阅读:

收集 CPU 负载的每秒测量值可能会产生有趣的数据,但收集、存储和分析这种频繁的测量值可能非常昂贵。如果您的监控目标要求高分辨率但不需要极低的延迟,您可以通过在服务器上执行内部采样来降低这些成本,然后配置一个外部系统以随时间或跨服务器收集和聚合该分布。

你可能:

  1. 每秒记录当前的 CPU 利用率。
  2. 使用 5% 粒度的存储桶,每秒增加适当的 CPU 利用率存储桶。
  3. 每分钟汇总这些值。此策略允许您观察短暂的 CPU 热点,而不会因收集和保留而产生非常高的成本。

有人可以解释“5% 粒度”部分吗?

monitoring

3
推荐指数
1
解决办法
143
查看次数

GCP 虚拟机磁盘空间警报

如何配置 GCP 监控套件以查看磁盘利用率百分比(使用的总空间,而不是 IOP)?

我在指标资源管理器中看到的唯一“已使用磁盘”指标似乎是每秒绘制某种单位的图表。

我的最终目标是在磁盘达到特定阈值(例如 85%)时设置警报,然后再填满。

monitoring system-monitoring google-compute-engine

3
推荐指数
1
解决办法
1552
查看次数