Cim*_*ity 7 networking linux windows unix
我在一家大公司工作,在那里我们使用许多遗留系统。注意一些系统:HP-UX 10.20、Windows 2000、VMEBus 系统、30 多年前设计的不通过 TCP/IP 协议进行通信的系统等等。
在整个工作周中,我们不断受到这些遗留系统之间失去通信的困扰。通常重新启动系统以尝试恢复通信是最后一种方法。人们普遍认为,重启系统只是无知同事的“万能”。我想知道,重新启动系统(旧系统与否)以恢复失败的通信线路是否有效?
我意识到在windows中更新IP地址应该可以有效地恢复网络通信;但是底层操作系统是否有可能出现更深层次的问题,可能会损坏并需要重新启动?一个失败的套接字超时,没有关闭,或者可能没有尝试重新连接?
在我看来,当拥有如此复杂的不匹配系统网络时,重新启动将是一个可行的解决方案。但是(至少在我的工作场所)当系统重新启动时,一切都神奇地重新开始工作,这总是“巧合”;从来没有解决方案。想法?
是的,“如果仍然无法正常工作,请重新启动并给我打电话”通常是系统管理员或没有想法的帮助台人员进行故障排除的第一行。我也会使用它,但是告诉某人重新启动服务器与让用户重新启动他们的工作站完全不同,这当然取决于服务器的用途。
我讨厌给出这个建议,但务实地说,有时对于您不能随意更换的真正遗留系统,如果重启可以解决问题,那么最好根据需要进行操作并努力证明升级的合理性而不是不必要地延长停机时间。
答案是“这取决于”。
重新启动可以修复问题,或者通过提供更好的日志记录或易于观察的问题来更轻松地检测问题。(嗯...重新启动应该不会花费 10 分钟)
然而,将重新启动作为标准故障排除技术是一种不好的做法。有人需要了解事物是如何断开连接的,以便您可以分类、隔离故障组件并开始解决问题。
我不想这么说,但了解一下 ITIL 之类的东西可能会很有用,特别是事件和问题管理。它可以帮助您或您的管理层重新组织您的支持系统,使其以合理的方式实际运作。