我需要一个 Python 中的 epub 到文本解决方案

Adr*_*ian 1 python epub

我需要从 epub 获取文本

from epub_conversion.utils import open_book, convert_epub_to_lines

f = open("demofile.txt", "a")
book = open_book("razvansividra.epub")
lines = convert_epub_to_lines(book)
Run Code Online (Sandbox Code Playgroud)

我使用这个,但如果我使用 print(lines) 它只会打印一行。图书馆已经有6年历史了。大家知道有什么好办法吗?

den*_*lor 5

https://github.com/aerkalov/ebooklib怎么样

EbookLib 是一个用于管理 EPUB2/EPUB3 和 Kindle 文件的 Python 库。它能够以编程方式读写 EPUB 文件(Kindle 支持正在开发中)。

API 的设计尽可能简单,同时也使复杂的事情成为可能。它支持封面、目录、书脊、指南、元数据等。

import ebooklib
from ebooklib import epub

book = epub.read_epub('test.epub')

for doc in book.get_items_of_type(ebooklib.ITEM_DOCUMENT):
    print doc
Run Code Online (Sandbox Code Playgroud)

  • @Adrian您可以使用 doc.content 来访问文本 (2认同)