Rag*_*geZ 8 php import office-2007 ms-word
我想在我们的CMS中添加一个单词导入功能,唯一的问题是我似乎找不到一个好的库来读取docx文件(Word 2007).
有没有人有一些建议,图书馆应该能够提取文档的内容和基本样式,如斜体,粗体,上标?
谢谢你的帮助
Ant*_*ony 11
docx文件实际上只是文档XML的容器.您应该能够解压缩docx文件,然后转到里面的word文件夹,然后转到document.xml.这有实际的文字.但是字体和样式之类的东西都在docx容器中的其他xml文件中,所以你可能想要搞砸一下并弄清楚它是什么以及如何匹配它(从使用命名空间开始,我敢打赌).
但是,是的,解压缩文件,然后使用simplexml将其转换为实际上可以乱用的东西.
| 归档时间: |
|
| 查看次数: |
23881 次 |
| 最近记录: |