您将使用哪些 WQL 查询来监控典型的 Windows 瓶颈?您将使用哪个来获取类似于“top”或“netstat”的数据?你会在什么时间间隔进行轮询?
这里有一些我觉得有帮助的。
SELECT PercentDiskTime, AvgDiskQueueLength, DiskReadBytesPerSec, DiskWriteBytesPerSec FROM Win32_PerfFormattedData_PerfDisk_PhysicalDisk
SELECT Caption, CommittedBytes, AvailableBytes, PercentCommittedBytesInUse, PagesPerSec, PageFaultsPerSec FROM Win32_PerfFormattedData_PerfOS_Memory
SELECT PercentProcessorTime FROM Win32_PerfFormattedData_PerfOS_Processor
SELECT Caption, WorkingSet, PageFaultsPerSec,IOReadBytesPerSec, IOWriteBytesPerSec, ThreadCount, HandleCount FROM Win32_PerfFormattedData_PerfProc_Process
SELECT Caption, BytesReceivedPerSec, BytesSentPerSec FROM Win32_PerfFormattedData_Tcpip_NetworkInterface
Run Code Online (Sandbox Code Playgroud) 我的服务器运行良好,但已使用 5 年以上。他们仍然在完美地完成这项工作,升级服务器没有任何优势,我应该让它们永远运行还是应该安排维护以用新硬件更换服务器或其部分?我担心服务器故障可能会导致数据丢失和比计划维护更多的停机时间。这些服务器用于在线销售点、会计、CRM 和管理信息。
由于服务器位置偏远,无法进行预防性维护,例如更换风扇和吸尘。
还要记住故障率随时间变化的“浴缸曲线”。新硬件比已经烧了一段时间的硬件更容易出现故障。
你如何告诉一个对长期无故障的服务器非常满意的客户,他现在不得不花钱更换它,因为它太旧了?
最后,有没有可以远程运行的电压、温度、风扇转速等硬件问题的监控工具?
我有一个文件服务器,它有一个非常大的文件夹树。有一个共享文件夹,下面是5个部门文件夹。嵌套在其中的是数以千计的子文件夹和文件。
我希望能够追踪这 5 个部门文件夹的增长情况。我还想关注某些特定的子子子文件夹。这样,如果我突然看到我的磁盘利用率 % 猛增,我可以知道这种增长发生在哪个文件夹中,因此我可以深入了解并发现 whodunnit。
我想过编写某种 vb 或 powershell 脚本(这需要学习语言)来对每个文件夹进行 DU,然后将表格写入文件或其他内容。但我认为这是在重新发明轮子,因为之前必须有人解决这个问题。有人知道在文件系统中绘制各种文件夹的(希望是免费软件/OSS)解决方案吗?
XYZ进程打开的文件可以通过命令找到
ls -l /proc/PID/fd
Run Code Online (Sandbox Code Playgroud)
无论如何,是否可以以更具交互性的方式完成,例如tail每 x 秒自动刷新一次?
Amazon CloudWatch 有一个不错的控制台和一个使用 Amazon SNS 进行通知的警报系统。
最初它只为您提供 AWS 指标,例如 EC2 实例 CPU 利用率。
最近他们添加了自定义指标。您可以使用 CloudWatch REST API 推送您自己的任意指标。
我想知道是否有人尝试使用代理通过 SNMP 和/或 WMI 轮询各种服务器(有些在 EC2,有些不在),并将这些样本作为自定义指标推送到 CloudWatch?因此,现在在 CloudWatch 中,您可以在一处查看所有指标(包括 AWS 和非 AWS)。
注意:我知道一些监控工具可以从 EC2 中提取,这是另一种将所有内容集中到一个地方的方法,并且由于各种原因可能优于某些人。但我问的是 CloudWatch 是一个地方的方式。
如果有人这样做,您使用什么作为代理?
我负责维护我们公司的 Prometheus 服务器。然而,这些指标是由团队提供的。
有没有办法找出存储在 Prometheus 数据库中的时间序列的数量?我们使用默认的 LevelDB 数据存储。我需要这些值来确定是否需要调整 Prometheus 实例的本地存储设置。
谢谢你的帮助。
我需要监控在我的网络服务器上运行的几个进程。出于某种原因,清漆目前每天或每两天崩溃一次。我正在使用 monit 据称自动重新启动清漆,但它不起作用。这是我的 Varnish 的 monit.conf 条目。
check process varnish with pidfile /var/run/varnish.pid
start program = "/etc/init.d/varnish start" with timeout 60 seconds
stop program = "/etc/init.d/varnish stop"
if failed host <my server ip> port 80 protocol http
and request "/blank.html" then restart
if 3 restarts within 5 cycles then timeout
group server
Run Code Online (Sandbox Code Playgroud)
日志文件显示,在varnish停止运行后,尝试重新启动之后都失败了。然后最终 monit 停止监视清漆。
有人对我如何解决这个问题有建议吗?或者更好的是,您能否提出其他简单的自动监控和重启崩溃进程的方法?谢谢!
我是一个小型计算机课程的老师。孩子们还年轻,我不能站在每台电脑后面确保他们不在 Itunes 或纸牌上。
从我的电脑屏幕上,有没有办法在一个小盒子里实时获取他们的屏幕信息(想想画中画),这样我就可以快速查看谁没有在执行任务,谁在执行任务?
monitoring ×10
files ×2
monit ×2
wmi ×2
amazon-ec2 ×1
directory ×1
hardware ×1
linux ×1
maintenance ×1
mysql ×1
ntfs ×1
process ×1
prometheus ×1
snmp ×1
varnish ×1
web-server ×1