解释错误日志的一般提示

use*_*ame 4 linux windows troubleshooting mac log-files

阅读日志文件可能非常令人沮丧,因为从本质上讲,它们的内容与问题本身一样多地说明了编写它们的开发人员。

您是否有任何解释错误日志的通用提示(例如:“google 是您的朋友”或“某些错误代码比其他错误代码出现得更多”或“请记住警告和错误是非常不同的”)?

And*_*mar 5

让开发人员不时解决生产问题。这将为您的日志记录创造奇迹。:)


kub*_*zyk 5

关于当您同时拥有所有这些时的特定常见情况:(1) 分布式环境中的问题 (2) 大量调试信息分散在协作服务器和不同的日志文件中 (3) 没有用于解释的文档日志 (4) 谷歌上什么都没有 (5) 没有线索 (6) 乒乓球运动员而不是供应商的支持。

  • 首先,确保时间在整个环境(ntp)中是同步的。如果不是,请忘记尝试从他们的日志文件中找出主机间的关系。
  • 不要从随机日志中挑选一个随机的“错误”来责备。按时间顺序阅读日志,记住“错误”行也可能是正常软件操作的结果,并且一直存在。
  • 将正确操作的日志与问题情况的日志进行比较。他们在什么时候不再匹配?(vimdiff 可能有用)
  • 如果在测试用例期间您具有插入自己的自定义日志消息的功能,请使用它。(就像系统日志中的记录器)
  • 在分析中,如果您发现自己在许多巨大的日志之间来回切换,试图捕捉动作流 - 尝试合并日志。(使用 sed 将时间放在第一列。使用 cat+sort 合并多个文件。当然还有 grep -viE 用于过滤不必要的行。)