Ale*_*rac 4 ms-word doc docx go
如何使用golang解析word文档“.doc”、“.docx”以获取所有文本?
Ale*_*hin 7
你可以从这些项目中获得一些灵感:
https://github.com/nguyenthenguyen/docx https://github.com/opencontrol/doc-template
基本上,DOCX 是一个包含 XML 的 Zip 文件。所有的文字都在里面document.xml
document.xml
这两个项目所做的是删除所有 XML 标签,只保留完整的文本。你应该看看这种方法是否也适合你。
归档时间:
9 年 前
查看次数:
7030 次
最近记录:
8 年,1 月 前