如何将 .epub 文件转换为纯文本?

dre*_*cko 42 epub format-conversion

我可以在 okular 中查看 epub 文件,选择所有文本并复制粘贴到文本编辑器中。我想要一个命令行方法-有人知道这样的事情吗?

zet*_*tah 49

我不知道 Calibre 是否值得为你的工作安装,但如果你有它,你可以使用强大的电子书转换器:

ebook-convert input.epub output.txt

从输出文件扩展名中扣除输出格式

我想可能有一些 XML 工具/脚本 (XSLT) 可以在文本中转换 epub,因为 epub 基本上是 ZIP 存档中的 XHTML


小智 8

另一种选择是Kevin Boone 的epub2txt,可在Github 上获得

epub2html 是一个简单的命令行实用程序,用于从 EPUB 文档中提取文本,并且可以选择重新排列它以适应特定列数的文本显示。它完全用 ANSI 标准 C 编写。

用法示例:

epub2txt input.epub > output.txt
Run Code Online (Sandbox Code Playgroud)


pie*_*ely 7

MuPDF可以转换epubhtmltxt.? 来安装它:

sudo apt install mupdf mupdf-tools
Run Code Online (Sandbox Code Playgroud)

要使用它:

mutool convert -o somefilename.txt somefilename.epub 
Run Code Online (Sandbox Code Playgroud)

它假定txt来自-o选项的输出。

有关更多信息,请参阅mutool convert 文档