作为一个自学成才的python爱好者,我将如何学习使用标准格式导入和导出二进制文件?
我想实现一个脚本,它采用ePub电子书(XHTML + CSS压缩)并将其转换为mobipocket(Palmdoc)格式,以便让亚马逊Kindle读取它(作为一个更大的项目的一部分,我'我正在努力).
已经有一个很棒的开源项目来管理电子书库:Calibre.我想尝试将其作为一种学习/自学练习来实现.我开始查看他们的python源代码并意识到我不知道发生了什么.当然,在任何事情上自学成才的重大危险就是不知道你不知道什么.
在这种情况下,我知道我不太了解这些二进制文件以及如何在python代码中使用它们(struct?).但是我想我可能一般都缺少很多关于二进制文件的知识,我想帮助理解如何使用它们. 以下是 mobi/palmdoc标题的详细概述.谢谢!
编辑:没问题,好点!您是否有任何关于如何获得使用二进制文件的基本知识的提示?特定于Python会有所帮助,但其他方法也可能有用.
TOM:编辑为问题,添加了介绍/更好的标题
Microsoft CHM格式很棒,因为它提供了这样的设施:
但是这种格式已经过时并且有许多缺点:
对于所有desctop操作系统都有读取器和编译器的CHM有什么替代方案吗?
PS.我听说QT就像KDE一样,NetBeans也使用自己的帮助格式.非特定供应商如何?
PPS.一些相关:
PPS.作为状态页面http://en.wikipedia.org/wiki/Comparison_of_e-book_formats最接近CHM的是EPUB和Mobipocket格式.但是这种格式在内部使用XHTML,因此EPUB/mobi读者可能无法正确呈现现有的html页面.同样作为这种格式的新手,我不知道他们是否在CHM中有TOC,索引和搜索.
我正在编写一个WordPress插件,用于从大多数主要电子书格式的选定类别创建电子书.我想支持MobiPocket,因为这是Kindle使用的格式,但我不知道如何去做.从我读过的.mobi文件实际上是Palm资源数据库(PRC),但我找不到PHP类来处理它们.
我考虑过exec与KindleGen一起使用,但这样做会不合适,因为它会使初始设置复杂化.我还想过在某个地方托管一个Web服务并使用XML-RPC来实现这个目标,但这也使事情变得复杂.
我的问题是:是否有一个PHP类/库(仅限PHP)可以使用PRC甚至更好,一个专门创建MobiPocket电子书的类?(因为我是根据GPL发布的,所以需要开源)
我试过搜索但却找不到任何东西.
我的目标是创建一本可以使用 Blackberry 上的 Mobipocket 阅读器阅读的电子书。问题是我的文本包含 Blackberry 不支持的 UTF-8 字符,因此显示为黑框。
\n\n该电子书将包含英语和旁遮普语单词列表以供参考,例如:
\n\nbait \xe0\xa8\xa6\xe0\xa8\xbe\xe0\xa8\xa3\xe0\xa8\xbe\nbaked \xe0\xa8\xad\xe0\xa9\x81\xe0\xa9\xb0\xe0\xa8\xa8\xe0\xa8\xbf\xe0\xa8\x86\nbalance \xe0\xa8\xb5\xe0\xa8\xbf\xe0\xa8\x9a\xe0\xa8\xbe\xe0\xa8\xb0\nRun Code Online (Sandbox Code Playgroud)\n\n我的一个想法是将列表写入 HTML 表,并将旁遮普语转换为 GIF 或 PNG 文件。然后将此 HTML 文件包含在电子书中。所有单词当前都存在于 Access 数据库中,但可以轻松导出到另一种形式以输入到生成例程。
\n\n问题:使用 VB、VBA 或 C#,编写一个例程来创建图像,然后输出一个包含表格中的英文单词和图像的 HTML 文件有多难
\n是否有免费的PHP库,它解析.mobi文件以获取:
编辑:
大家谁认为这是一个确切的重复的做一个PHP库中存在与PRC/MOBI需要翻译的文件,你显然懒得看问题.
那个提问者想知道如何使用PHP库生成.mobi文件.我想知道如何拆分或解析已创建的.mobi文件以获取某些信息.因此,解决这个问题,phpMobi将无法正常工作,因为它是一个从HTML生成.mobi文件的脚本,而不是解析.mobi文件.