我怎么读.docx文件?

TCM*_*TCM 9 c# docx

我有一个.docx文件,它包含许多我要批量邮件的电子邮件地址.我如何通过c#读取docx文件?

Ger*_*ald 12

最简单的方法可能是使用Open XML SDK 2.0

获取Visual Studio 2008的代码片段以获取一些示例

我强烈建议下载Open XML SDK生产力工具,它将帮助您了解Open XML文件的结构,甚至可以帮助您根据文档结构生成与SDK一起使用的源代码.您可以从SDK的同一页面下载该工具.这是100MB,但值得下载.


Muh*_*man 8

您可以简单地使用Docx库,它非常好用且易于使用.

有关如何使用的示例以及许多示例和视频,请查看其GitHub页面.要下载,您可以从这里下载


Ber*_*van 6

您可以通过Interop读取Microsoft Office文件,也可以通过Open XML读取Office> 2007文件:


Mat*_*len 5

docx 文件实际上是档案。

您可以将它们解压缩到复合 XML 文件中,并通读相关的 XML 文件 (file.docx\word\document.xml)) 并提取电子邮件地址。

该库将帮助您解压缩存档:.Net Zip Library


小智 5

是的,我知道这是一篇非常古老的帖子,但这些信息可能有助于其他正在搜索论坛的人.

使用Sourceforge中的这个库.添加对该库的引用,然后:

Code7248.word_reader.TextExtractor extractor = new TextExtractor(filePath);

string contents = extractor.ExtractText();