标签: monitoring

达到 nginx 状态时绕过本地主机上的 SSL

我有一个位置/nginx_status，我昨晚安装了一个 SSL 证书。

server {
    listen 443;
    ...
    location /nginx_status {
        stub_status on;
        access_log off;
        allow 127.0.0.1;
        deny all;
    }
}

Run Code Online (Sandbox Code Playgroud)

当它仍然在端口 80 上时，这是在进行证书前安装。现在，我已经进行了重定向以将 www.domain.tld 和 domain.tld 流量重定向到 https，例如

server {
        listen 80;
        server_name domain.tld;
        return 301 https://domain.tld$request_uri;
}

server {
        listen 80;
        server_name www.domain.tld;
        return 301 https://domain.tld$request_uri;
}

Run Code Online (Sandbox Code Playgroud)

我正在使用 graphdat-relay 来监视 nginx 统计信息，现在curl http://127.0.0.1/nginx_status 只获取重定向页面，例如

<html>
<head><title>301 Moved Permanently</title></head>
<body bgcolor="white">
<center><h1>301 Moved Permanently</h1></center>
<hr><center>nginx/1.6.2</center>
</body>
</html>

Run Code Online (Sandbox Code Playgroud)

我如何告诉 nginx 绕过 SSL 并仅在本地允许 /nginx_status ？

ubuntu monitoring nginx ubuntu-12.10

Dav*_*Fox

lucky-day

3
推荐指数

1
解决办法

2706
查看次数

使用外部 eSATA RAID5 SATA 端口倍增器时如何监控 RAID 状态？

我正在使用一个外部 eSATA 设备，它需要 5 个 SATA 驱动器并将它们作为一个大型硬件 RAID5 呈现给 linux (ubuntu)。

它使用 SiI3726 芯片组。

Linux 可以很好地查看和处理 sata 设备，但我想知道是否有任何方法可以查询/监控隐藏在此硬件 RAID 后面的 RAID5 状态。

（来自 dmesg - 我发誓我没有 16T 单驱动器......）

[   16.409678] sd 4:0:0:0: [sde] 31255691264 512-byte logical blocks: (16.0 TB/14.5 TiB)
[   16.409727] sd 4:0:0:0: [sde] Write Protect is off
[   16.409730] sd 4:0:0:0: [sde] Mode Sense: 00 3a 00 00
[   16.409752] sd 4:0:0:0: [sde] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
[   16.463573]  sde: sde1 …

Run Code Online (Sandbox Code Playgroud)

linux raid monitoring esata

Joe*_*l K

2015 03-23

3
推荐指数

1
解决办法

1910
查看次数

Monit 忽略内存使用阈值配置

我从 Ubuntu 存储库安装了 Monit 5.6，以提醒我 VPS 上异常高的内存和 CPU 使用率。事实证明，75% 的内存使用率对于我的设置来说很常见，所以我更改了在 file 中设置限制的行/etc/monit/conf.d/system.conf：

check system localhost
  ...
  if memory usage > 90% then alert

Run Code Online (Sandbox Code Playgroud)

但现在它会在 75% 阈值和 90% 时提醒我。我搜索了其他地方可以设置它：grep 75% -r /etc/monit/，但没有匹配。Monit 在默认设置中是否还有其他地方存储其配置文件？还是 75% 的限制是以某种方式硬编码在其中的？我怎样才能禁用它？

UPD：我尝试在更改后重新加载和重新启动 monit（虽然没有尝试重新启动服务器）。我的 Monit 版本是：

# monit -V
This is Monit version 5.6
Copyright (C) 2001-2013 Tildeslash Ltd. All Rights Reserved.

Run Code Online (Sandbox Code Playgroud)

和配置文件：

check system localhost
  if loadavg (1min) > 4 then alert
  if loadavg (5min) > 3 then alert
  if memory usage …

Run Code Online (Sandbox Code Playgroud)

monitoring monit

Hna*_*att

2019 03-25

3
推荐指数

1
解决办法

1240
查看次数

使用 Nagios 监控 Windows 页面文件

我有一个 NAGIOS 检查来监控 Windows 机器上的虚拟内存，这个检查返回所有使用的虚拟内存（物理+页面文件的最大大小）。

这不是我想要的，我试图搜索一些只监视 Windows 机器上页面文件使用情况的检查，但我没有找到任何有趣的东西。

您是否知道任何监控页面文件是否被 Windows 使用的 SNMP 检查？

windows monitoring nagios pagefile

ob_*_*dev

2015 01-21

3
推荐指数

1
解决办法

5162
查看次数

Icinga2：在主机/服务关闭时发送电子邮件

我用 icingaweb2 安装并配置了 Icinga2。

我添加了一个带有测试服务的测试主机：我们称之为“example.com”。

这是测试主机：

/etc/icinga2/conf.d/hosts/example-com：

object Host "example-com" {
        //Importiert die generische Host-Vorlage aus der template.conf
        import "generic-host"
        //IPv4 Adresse
        address = "2xx.2xx.2xx.2xx"

        //Angabe des Betriebssystemtyps
        vars.os = "Linux OS"
        vars.sla = "24x7"
}

Run Code Online (Sandbox Code Playgroud)

好的，那么我们有了服务配置：

/etc/icinga2/conf.d/hosts/example-com/http.conf

object Service "http" {
    import "generic-service"
    host_name = "example-com"
    check_command = "http"
    vars.sla = "24x7"
}

Run Code Online (Sandbox Code Playgroud)

当然我在/etc/icinga2/conf.d/users.conf中添加了一个新的用户组

/**
 * The example user 'icingaadmin' and the example
 * group 'icingaadmins'.
 */

object User "icingaadmin" {
  import "generic-user"

  display_name = "Icinga 2 Admin"
  groups …

Run Code Online (Sandbox Code Playgroud)

monitoring icinga icinga2

MyF*_*ult

2016 01-05

3
推荐指数

1
解决办法

3万
查看次数

如何在午夜设置 icinga2 停机时间

我们的备份在 22:00 到第二天大约 05:00 之间运行。我无法弄清楚如何在 icinga2（opensuse 42.1 上的 r2.4.1-1）中使用“apply ScheduledDowntime”在预定停机时间内设置它。

只是设置 22:00-05:00 给我一个错误：

无效的时间范围定义“22:00-05:00”：时间段在开始之前结束

当前机制使用一个服务变量backup_downtime，当它不为空时又会触发“apply”规则：

apply ScheduledDowntime "backup-downtime" to Service {
  author = "icingaadmin"
  comment = "Scheduled downtime for backup"

  ranges = {
    monday = service.vars.backup_downtime
    tuesday = service.vars.backup_downtime
    wednesday = service.vars.backup_downtime
    thursday = service.vars.backup_downtime
    friday = service.vars.backup_downtime
    saturday = service.vars.backup_downtime
    sunday = service.vars.backup_downtime
  }

  assign where service.vars.backup_downtime != ""
}

Run Code Online (Sandbox Code Playgroud)

有人有想法吗？谢谢

linux backup monitoring icinga

B. *_*ger

lucky-day

3
推荐指数

1
解决办法

3386
查看次数

Sensu API 没有响应。内轮：连接错误。Sensu API 是否正在运行？Redis问题

我一直在按照官方文档一遍又一遍地在 CentOS7.2 上设置 sensu 但是我一直无法让它工作：

我似乎无法连接到 API。Uchiwa 给出了错误：

ALERT
Datacenter site1 returned:
Connection error. Is the Sensu API running?`

Run Code Online (Sandbox Code Playgroud)

我试过：curl -I http://localhost:4567/clients ...我没有得到回应。

这是/var/log/sensu/sensu-api.log http://pastebin.com/wHEHE0bH

我一直在创建一个脚本以使设置可重复。请参阅下面显示我的配置的脚本：http : //pastebin.com/QEt5Msku 如果您在 CentOS7 上运行该脚本，它应该会重复这个问题。

使固定：

问题在下面的回答中。在遵循在新 VM 上成功安装 sensu 的非官方指南之后，我比较了两个设置步骤，并在新 VM 上进行了几次构建后，一点一点地交换了步骤，我想出了用非官方指南中的一个替换 repo指向一个稍微不同的 URL 修复了我的问题（CentOS6 的 repo 但它适用于 7，它只安装了一个非当前版本 0.20.3）。

echo '[sensu]
name=sensu-main
baseurl=http://repos.sensuapp.org/yum/el/6/x86_64/
gpgcheck=0
enabled=1' > /etc/yum.repos.d/sensu.repo

Run Code Online (Sandbox Code Playgroud)

monitoring rabbitmq redis sensu centos7

ZZ9*_*ZZ9

2016 04-08

3
推荐指数

1
解决办法

3908
查看次数

/proc/diskstats: 没有那个文件或目录

尝试获取一些磁盘性能指标（特别是使用 munin），发现 /proc/diskstats不存在。

尝试过，yum provides '*/diskstats'但除了 munin 什么都没找到。

CentOS 6.7 版（最终版）

uname -a
Linux domain.com 2.6.32-042stab112.15 #1 SMP Tue Oct 20 17:22:56 MSK 2015 x86_64 x86_64 x86_64 GNU/Linux

Run Code Online (Sandbox Code Playgroud)

那么，我该如何解决呢？

monitoring performance drive statistics proc

Put*_*nik

lucky-day

3
推荐指数

1
解决办法

1529
查看次数

理解谷歌 SRE 书中的一个例子

我目前正在阅读谷歌的 SRE 书，这是一本非常有趣的书。

在第 6 章 - 监控分布式系统中，有一节解释了如何选择合适的度量。

我不明白作者在解释测量粒度很重要时给出的例子。我们可以阅读：

收集 CPU 负载的每秒测量值可能会产生有趣的数据，但收集、存储和分析这种频繁的测量值可能非常昂贵。如果您的监控目标要求高分辨率但不需要极低的延迟，您可以通过在服务器上执行内部采样来降低这些成本，然后配置一个外部系统以随时间或跨服务器收集和聚合该分布。

你可能：

每秒记录当前的 CPU 利用率。

使用 5% 粒度的存储桶，每秒增加适当的 CPU 利用率存储桶。

每分钟汇总这些值。此策略允许您观察短暂的 CPU 热点，而不会因收集和保留而产生非常高的成本。

有人可以解释“5% 粒度”部分吗？

monitoring

K B*_*Ben

2020 06-11

3
推荐指数

1
解决办法

143
查看次数