处理Word文档的最佳方法

Mik*_*ail 11 python parsing ms-word xml-serialization

我收到带有指定格式的word文档,这些格式对应于其中的数据.例如,所有标题都具有完全相同的格式(Times New Roman-Font 14-Bold).

将此类MS Word文档(.doc或.docx)处理成xml文档的最佳方法是什么?语言不是问题(如果必须,我将使用Lisp/Boost.Spirit!).

Eti*_*nne 9

看一下python-docx库.


Mik*_*ail 2

在 VBA 中使用非常低效的条件搜索将文档逐字复制到第二个文档中。然后使用 .xml 扩展名保存第二个文档。任务完成了,但是很丑。