为了在python中使用MS word文件,有python win32扩展,可以在windows中使用.我如何在linux中做同样的事情?有图书馆吗?
有没有合理的方法从不依赖于COM自动化的Word文件中提取纯文本?(这是部署在非Windows平台上的Web应用程序的一项功能 - 在这种情况下是不可协商的.)
Antiword似乎可能是一个合理的选择,但似乎它可能会被抛弃.
Python解决方案是理想的,但似乎不可用.
是否可以在不使用COM对象的情况下读取和编写Python中的Word(2003和2007)文件?
我知道我可以:
f = open('c:\file.doc', "w")
f.write(text)
f.close()
Run Code Online (Sandbox Code Playgroud)
但Word会将其读作HTML文件而不是本机.doc文件.