我们正在开发一个数据库工具,我们希望以一种可扩展且易于导入数据库表的格式编写日志文件.我们都觉得使用SQL过滤这些信息是一个好主意,因为日志将是一个长文件,"搜索"可能不够好.你能给我一些建议吗?任何经验也都有用!提前致谢.
我要说的第一件事是你的文件格式应该是人类可读的.我的理由在这里给出:我为什么要使用人类可读的文件格式.
除此之外,用这样一个模糊的问题回答是不可能的.但是,以下是您应该考虑的一些问题:
当你能回答所有这些问题时,你可能会自己知道答案.如果没有,请回答这些问题,使您的问题更具体,并且有人可以更轻松地为您提供帮助.
就个人而言,当日志数据写成CSV时,我一直很感激.它足够灵活,可以扩展(添加额外的列,更改字段的长度),快速读取和写入数据库电子表格,以及数百种其他工具,并且可以在几秒钟内编码.但是,它确实有许多缺点 - 它是冗长的,容易逃脱错误,无类型,并且如果重新排列列,则容易中断.
我们发现日志往往是一个严重的性能问题.创建不会减慢公共网站速度的日志具有挑战性.
如果您有一个大型日志并希望能够在没有慢速的情况下对它运行SQL查询,那么您将需要某些列上的索引.您添加的每个索引都会大大减慢插入新日志条目的速度,从而导致高流量时出现负载问题.
我们的技术是:
这使我们可以快速记录日志条目,而不会牺牲日志表中的索引,从而为我们提供针对日志表的快速SQL查询.
我们已经在各种CentOS服务器上使用了大约6或7年,并且它一直坚如磐石.我想根据操作系统及其配置方式,这可能不是创建日志文件的好方法.但它在我们的测试中效果很好.
PS:我认为使文件具有人类可读性没有任何意义.您只会在调试期间阅读它,然后再也不会再触摸它.