在浏览器中呈现非常大的HTML文件？

Question

在浏览器中呈现非常大的HTML文件？

我正在尝试通过一个有趣的项目 - 一个Facebook消息分析器来学习Python.我已经从Facebook上下载了我的数据,其中包括一组html文件.其中一个 - messages.htm - 包含我的所有消息.我的目标是获取这个html文件并将其解析出来输出有趣的数据,如最常见的单词,消息的数量等.

问题是我的messages.htm文件是270MB.我可以在vim中检查它,但文件中有一些有趣的模式,我想比较html代码与它在浏览器上实际呈现的方式,这样我就可以将代码与视觉效果进行比较,更好地了解什么是继续但是当我尝试在Firefox中打开这个文件时,FF会崩溃.我可以在Chrome中打开它,但它只是开始加载所有消息,并且大约10分钟内它甚至没有完全加载单个消息线程,无论滚动条有多小.所以这是不可行的.

甚至可以完全呈现如此大而长的HTML文件吗？

Answer 1

ign*_*ite 5

您可以使用基于文本的浏览器lynx来查看大型 html 文件。我有一个 139M 的 html 文件，我可以使用lynx. lynx将整个文档分成几页，并且能够非常快速地加载任何给定的页面。它还支持超链接，因此在 html 文档（这是我的用例）中导航就像一个魅力。

归档时间：	10 年，10 月前
查看次数：	9599 次
最近记录：	9 年，10 月前