我有一个大约15GB的文件,它是一个日志文件,我应该分析输出.我已经对一个类似但非常小的文件进行了基本解析,只需几行日志记录.解析字符串不是问题.问题是巨大的文件及其包含的冗余数据量.
基本上我正在尝试制作一个我可以说的python脚本; 例如,给我5000个文件的最后一行.这又是基本的处理论点和所有这些,没有什么特别的,我可以做到这一点.
但是,如何定义或告诉文件阅读器只读取我从文件末尾指定的行数?我试图跳过文件开头的huuuuuuge数量,因为我对这些不感兴趣,说实话,从txt文件中读取大约15GB的行需要太长时间.有没有办法犯错误...从文件末尾开始阅读?这甚至有意义吗?
这一切都归结为读取15GB文件的问题,一行一行需要太长时间.所以我想在开始时跳过已经冗余的数据(至少对我来说是冗余的),只读取我想要读取的文件末尾的行数.
明显的答案是手动只是将N行的数量从文件复制到另一个文件,但有没有办法半自动地神奇地只是用python读取文件末尾的N行数?
我已经逐渐喜欢paper.js但是在意识到它不支持IE8后,我想知道是否有可能让paper.js与excanvas一起工作?有人测试过这个并且有可用的例子吗?
谢谢.
如何计算VS_KEY容器名称?它们通常是这样的:VS_KEY_71E582524B5DDE29.
我假设它基于计算机名称,但如果我们运行的云服务每次实例重新启动时随机更改计算机名称会怎么样?
我们需要在实例启动时拥有容器名称,以便我们知道将私钥存储到哪个容器中,因此构建工具和所有工作都应该如此.我们需要自动设置容器名称.
所以基本上我们需要找到一种方法来在每次计算机重新启动时生成正确的容器名称.任何提示或帮助?