Raj*_*eev 11 python python-3.x
就像csv.reader()是有可以读取任何其他功能.rtf,.txt,.doc在Python文件?
您可以阅读文本文件
txt = open("file.txt").read()
Run Code Online (Sandbox Code Playgroud)
尝试PyRTF for RTF文件.我认为读取MS Word .doc文件是不太可能的,除非你在Windows上,你可以使用一些本机MS接口来读取这些文件.本文声明如何编写与Word交互的脚本.
试图为 word 和 writer 文档做这个简单的事情时,我真的很头疼。
有一个简单的解决方案:在命令行调用 openoffice 将目标文档转换为文本,然后将文本加载到 Python 中。
我尝试过的其他转换工具产生的输出不可靠,而其他 Python oOo 库太复杂了。
如果您只想获取文本以便处理它,请在 linux 命令行上使用它:
soffice --headless --convert-to txt:Text /path_to/document_to_convert.doc
Run Code Online (Sandbox Code Playgroud)
(如果你想自动化它,使用子进程从 Python 调用它)。
它将创建您可以简单地加载到 python 中的文本文件。
(信用)
| 归档时间: |
|
| 查看次数: |
35643 次 |
| 最近记录: |