我需要能够判断一系列服务器上是否有人活动,如果没有,则自动关闭它们(关闭 VM)。这不是一项微不足道的任务,因为我有 1000 多个服务器实例,其中包括各种操作系统(Win、Unix、Linux)和许多不同类型的配置。这使得在盒子上安装正常运行时间代理变得非常重要。此外,由于用户是管理员,我无法真正确保我安装的工具不会被篡改。
所以我的想法是将每个服务器视为一个黑匣子,并使用来自服务器外部的统计信息来确定是否有活动:
如果我有 90% 的准确率,我不在乎关闭比真正空闲的机器更多的机器。上面的黑匣子会起作用还是不可靠?哪些黑盒指标更合适?