进行 [linux] 系统和环境验证的更好方法?

dha*_*ord 5 linux

有没有更好的方法来进行环境验证?用例是一个虚拟化环境,由其他人创建的接近 300 台服务器,需要在接受它们之前进行验证(即在我安装自定义软件并事后发现问题之前)。

这些目前都是通过纸质清单手动完成的

  • ssh 到 linux 服务器 [这样就可以从框中运行以下测试]
  • 对于它与之通信的每个服务器:
    • ping -c 20 X linux服务器预期通信的目标服务器,查看丢包率和RTT avg/max/deviation
    • telnet 目标服务器,以确保适当的端口是开放的,并且它们提供的服务可以访问(即 1433 sql server、3306 mysql、80 webservice、25 smtp)
  • nslookup 以确保在 DNS 上设置服务器。

有没有更好的方法来进行系统验证?

这些目前都是通过纸质清单手动完成的

  • ssh到linux服务器
  • cat /proc/cpuinfo 检查 CPU 核心数和时钟速度是否符合要求
  • df 检查分配的磁盘空间
  • free -m 检查内存量

是否有更好方法的示例,例如在检查中设置预期值或范围,然后简单地运行“所有”测试以进行通过/失败检查?

dha*_*ord 4

几年后,但我一直在寻找的答案是在:

http://www.ansible.com

收集事实:真实

由于 ansible 本身是通过 ssh 实现无代理的,因此这已经解决了 ssh 访问需求。

Gather_facts 功能已经获得了目标系统所需的大量数据,只需对其进行评估即可(磁盘空间示例:https ://stackoverflow.com/questions/26981907/using-ansible-to-manage-disk-space )。

我还没有评估 ansible 对于目标系统的网络/防火墙要求,但看起来非常可行!