如何从纯C++中的MS word文档文件中提取纯文本?

ila*_*o j 7 c++

是否有任何纯C++库从.doc文件中提取纯文本?

我正在开发一个C++程序来读取.doc和.pdf文件.我必须从文件中提取纯文本并将其写入.txt文件.

Neo*_*ard 1

如果您想操作/读取 .doc 文件,您可以花时间学习格式并手动操作 .doc 文件。您可以在链接到格式规范(PDF 文件)的 MSDN 页面上获取它。
我承认,这是相当多的阅读量,但如果您想创建软件来操作/读取文件,您应该拥有相关的基础知识来支持这一切。

pdf 格式也是如此(这是一种开放格式,因此规范应该很容易找到)。