python中的Doc,rtf和txt阅读器

Raj*_*eev 11 python python-3.x

就像csv.reader()是有可以读取任何其他功能.rtf,.txt,.doc在Python文件?

Jes*_*lon 9

您可以阅读文本文件

txt = open("file.txt").read()
Run Code Online (Sandbox Code Playgroud)

尝试PyRTF for RTF文件.我认为读取MS Word .doc文件是不太可能的,除非你在Windows上,你可以使用一些本机MS接口来读取这些文件.本文声明如何编写与Word交互的脚本.


mar*_*ing 5

试图为 word 和 writer 文档做这个简单的事情时,我真的很头疼。

有一个简单的解决方案:在命令行调用 openoffice 将目标文档转换为文本,然后将文本加载到 Python 中。

我尝试过的其他转换工具产生的输出不可靠,而其他 Python oOo 库太复杂了。

如果您只想获取文本以便处理它,请在 linux 命令行上使用它:

soffice --headless --convert-to txt:Text /path_to/document_to_convert.doc
Run Code Online (Sandbox Code Playgroud)

(如果你想自动化它,使用子进程从 Python 调用它)。

它将创建您可以简单地加载到 python 中的文本文件。

信用