标签: monitoring

MySQL监控工具

您使用哪些工具来监控 MySQL 服务器实例的健康状况?它们是免费的还是商业的?

mysql monitoring

12
推荐指数
2
解决办法
4069
查看次数

常见的 WQL 监控查询

您将使用哪些 WQL 查询来监控典型的 Windows 瓶颈?您将使用哪个来获取类似于“top”或“netstat”的数据?你会在什么时间间隔进行轮询?

这里有一些我觉得有帮助的。

SELECT PercentDiskTime, AvgDiskQueueLength, DiskReadBytesPerSec, DiskWriteBytesPerSec FROM Win32_PerfFormattedData_PerfDisk_PhysicalDisk

SELECT Caption, CommittedBytes, AvailableBytes, PercentCommittedBytesInUse, PagesPerSec, PageFaultsPerSec FROM Win32_PerfFormattedData_PerfOS_Memory

SELECT PercentProcessorTime FROM Win32_PerfFormattedData_PerfOS_Processor

SELECT Caption, WorkingSet, PageFaultsPerSec,IOReadBytesPerSec, IOWriteBytesPerSec, ThreadCount, HandleCount FROM Win32_PerfFormattedData_PerfProc_Process

SELECT Caption, BytesReceivedPerSec, BytesSentPerSec FROM Win32_PerfFormattedData_Tcpip_NetworkInterface
Run Code Online (Sandbox Code Playgroud)

monitoring wmi

12
推荐指数
1
解决办法
6268
查看次数

旧服务器是否应该退役

我的服务器运行良好,但已使用 5 年以上。他们仍然在完美地完成这项工作,升级服务器没有任何优势,我应该让它们永远运行还是应该安排维护以用新硬件更换服务器或其部分?我担心服务器故障可能会导致数据丢失和比计划维护更多的停机时间。这些服务器用于在线销售点、会计、CRM 和管理信息。

由于服务器位置偏远,无法进行预防性维护,例如更换风扇和吸尘。

还要记住故障率随时间变化的“浴缸曲线”。新硬件比已经烧了一段时间的硬件更容易出现故障。

你如何告诉一个对长期无故障的服务器非常满意的客户,他现在不得不花钱更换它,因为它太旧了?

最后,有没有可以远程运行的电压、温度、风扇转速等硬件问题的监控工具?

hardware maintenance monitoring

12
推荐指数
2
解决办法
4247
查看次数

跟踪文件夹大小随时间增长的最佳方法?

我有一个文件服务器,它有一个非常大的文件夹树。有一个共享文件夹,下面是5个部门文件夹。嵌套在其中的是数以千计的子文件夹和文件。

我希望能够追踪这 5 个部门文件夹的增长情况。我还想关注某些特定的子子子文件夹。这样,如果我突然看到我的磁盘利用率 % 猛增,我可以知道这种增长发生在哪个文件夹中,因此我可以深入了解并发现 whodunnit。

我想过编写某种 vb 或 powershell 脚本(这需要学习语言)来对每个文件夹进行 DU,然后将表格写入文件或其他内容。但我认为这是在重新发明轮子,因为之前必须有人解决这个问题。有人知道在文件系统中绘制各种文件夹的(希望是免费软件/OSS)解决方案吗?

files monitoring ntfs directory disk-space-utilization

12
推荐指数
1
解决办法
3万
查看次数

监控linux上打开的进程文件(实时)

XYZ进程打开的文件可以通过命令找到

ls -l /proc/PID/fd
Run Code Online (Sandbox Code Playgroud)

无论如何,是否可以以更具交互性的方式完成,例如tail每 x 秒自动刷新一次?

files monitoring performance-monitoring process

12
推荐指数
3
解决办法
2万
查看次数

是否有人使用 SNMP 和/或 WMI 轮询器将自定义指标推送到 Amazon CloudWatch,如果是,如何?

Amazon CloudWatch 有一个不错的控制台和一个使用 Amazon SNS 进行通知的警报系统。

最初它只为您提供 AWS 指标,例如 EC2 实例 CPU 利用率。

最近他们添加了自定义指标。您可以使用 CloudWatch REST API 推送您自己的任意指标。

我想知道是否有人尝试使用代理通过 SNMP 和/或 WMI 轮询各种服务器(有些在 EC2,有些不在),并将这些样本作为自定义指标推送到 CloudWatch?因此,现在在 CloudWatch 中,您可以在一处查看所有指标(包括 AWS 和非 AWS)。

注意:我知道一些监控工具可以从 EC2 中提取,这是另一种将所有内容集中到一个地方的方法,并且由于各种原因可能优于某些人。但我问的是 CloudWatch 是一个地方的方式。

如果有人这样做,您使用什么作为代理?

monitoring snmp wmi amazon-ec2 amazon-cloudwatch

12
推荐指数
1
解决办法
3860
查看次数

Monit 系统管理系统的 M/Monit 界面的免费替代品

我真的很喜欢Monit系统管理系统,但我没有 IT 预算来购买 M/Monit 接口,该接口用于管理我们小型大学实验室的多台主机。我检查了基于 Ruby 的 monittr,我看到 Django 人正在做一些事情。谁能给我一些简单的包装器的建议,它可以帮助我从多个服务器中提取信息?

编辑:这个问题如何重复?我不是在问监控工具。在过去的两周里,我大概评估了其中的六个。我在问一个关于非常具体的监控工具的非常具体的问题。我承认,虽然我从ewwhite那里收到的评论可能令人不快, 但这是一个有效的观察。

monitoring monit

12
推荐指数
1
解决办法
2万
查看次数

如何找出Prometheus LevelDB中存储的时间序列数量

我负责维护我们公司的 Prometheus 服务器。然而,这些指标是由团队提供的。

有没有办法找出存储在 Prometheus 数据库中的时间序列的数量?我们使用默认的 LevelDB 数据存储。我需要这些值来确定是否需要调整 Prometheus 实例的本地存储设置。

谢谢你的帮助。

monitoring system-monitoring prometheus

12
推荐指数
3
解决办法
2万
查看次数

重新启动崩溃进程的简单方法?

我需要监控在我的网络服务器上运行的几个进程。出于某种原因,清漆目前每天或每两天崩溃一次。我正在使用 monit 据称自动重新启动清漆,但它不起作用。这是我的 Varnish 的 monit.conf 条目。

check process varnish with pidfile /var/run/varnish.pid
    start program = "/etc/init.d/varnish start" with timeout 60 seconds
    stop program = "/etc/init.d/varnish stop"
    if failed host <my server ip> port 80 protocol http
        and request "/blank.html" then restart
    if 3 restarts within 5 cycles then timeout
    group server
Run Code Online (Sandbox Code Playgroud)

日志文件显示,在varnish停止运行后,尝试重新启动之后都失败了。然后最终 monit 停止监视清漆。

有人对我如何解决这个问题有建议吗?或者更好的是,您能否提出其他简单的自动监控和重启崩溃进程的方法?谢谢!

linux monitoring web-server varnish monit

11
推荐指数
1
解决办法
4万
查看次数

如何在一台计算机上监控多个屏幕?(在教室里说?)

我是一个小型计算机课程的老师。孩子们还年轻,我不能站在每台电脑后面确保他们不在 Itunes 或纸牌上。

从我的电脑屏幕上,有没有办法在一个小盒子里实时获取他们的屏幕信息(想想画中画),这样我就可以快速查看谁没有在执行任务,谁在执行任务?

remote-access monitoring remote-desktop

11
推荐指数
3
解决办法
2万
查看次数