任何人都知道他们可以推荐什么,以便从.doc或.docx中提取纯文本?
我发现这种最好的方法从Word文档中提取文本而不使用COM /自动化? - 想知道是否还有其他建议?
速度并不重要,我们甚至可以使用具有一些API的网站上传和提取文件,但我一直无法找到.
谢谢
为了在python中使用MS word文件,有python win32扩展,可以在windows中使用.我如何在linux中做同样的事情?有图书馆吗?
我想创建一个验证工具;
任何人都可以帮我读取Python中的.doc/.docx文档,以便搜索和比较文件内容.