d33*_*tah 7 xml kindle mediawiki
我想将整个 Deus Ex Wikia 的 XML 转储转换为我的 Kindle。我怎样才能做到这一点?
如果有人想在发布答案之前尝试他们的解决方案,这里是压缩的 XML 文件:http : //dumps.wikia.net/e/en/endeusex/pages_current.xml.gz
我想出了一个无需太多努力就能做到的方法。我已经设置了自己的 Mediawiki 安装并导入了 XML(我需要增加 PHP 配置中的限制 - 涉及最大执行时间和上传文件大小的限制)。在我的上网本上花了相当多的时间。在结果页面上,我可以复制页面列表,然后用于egrep -v
过滤掉非内容页面,例如用户个人资料、讨论、模板等。
然后我安装了EPubExport。我访问了Special:EpubPrint
页面并复制了过滤后的页面列表。生成电子书花了很长时间,然后将 EPUB 转换为 .mobi 又花了两个小时。输出文件很长(我怀疑用户写的内容与米切尔在《云图》一书中写的内容一样多),但从预览来看,它看起来是合法的。但它缺少图像,因为它们不在 XML 中。我会在有更多空闲时间时阅读一次,并让您知道从长远来看它是如何运作的。如果您想自己阅读电子书,可以在这里找到。您需要跳转到“Deus Ex”文章,因为我忘记从输出文件中剪切索引页。
归档时间: |
|
查看次数: |
1630 次 |
最近记录: |