在PHP中阅读docx(Office Open XML)

Rag*_*geZ 8 php import office-2007 ms-word

我想在我们的CMS中添加一个单词导入功能,唯一的问题是我似乎找不到一个好的库来读取docx文件(Word 2007).

有没有人有一些建议,图书馆应该能够提取文档的内容和基本样式,如斜体,粗体,上标?

谢谢你的帮助

Ant*_*ony 11

docx文件实际上只是文档XML的容器.您应该能够解压缩docx文件,然后转到里面的word文件夹,然后转到document.xml.这有实际的文字.但是字体和样式之类的东西都在docx容器中的其他xml文件中,所以你可能想要搞砸一下并弄清楚它是什么以及如何匹配它(从使用命名空间开始,我敢打赌).

但是,是的,解压缩文件,然后使用simplexml将其转换为实际上可以乱用的东西.


Ant*_*ony 2

或者,由于您请求了一个库,您可能想研究一下诸如Docvert之类的东西。我只是根据你的问题四处寻找,这是迄今为止我最喜欢的 PHP 。您输入单词文件位置,它会将其转换为带有属性和所有好东西的简单内容。