我需要从 epub 获取文本
from epub_conversion.utils import open_book, convert_epub_to_lines
f = open("demofile.txt", "a")
book = open_book("razvansividra.epub")
lines = convert_epub_to_lines(book)
Run Code Online (Sandbox Code Playgroud)
我使用这个,但如果我使用 print(lines) 它只会打印一行。图书馆已经有6年历史了。大家知道有什么好办法吗?
https://github.com/aerkalov/ebooklib怎么样
EbookLib 是一个用于管理 EPUB2/EPUB3 和 Kindle 文件的 Python 库。它能够以编程方式读写 EPUB 文件(Kindle 支持正在开发中)。
API 的设计尽可能简单,同时也使复杂的事情成为可能。它支持封面、目录、书脊、指南、元数据等。
import ebooklib
from ebooklib import epub
book = epub.read_epub('test.epub')
for doc in book.get_items_of_type(ebooklib.ITEM_DOCUMENT):
print doc
Run Code Online (Sandbox Code Playgroud)