Open XML SDK 仅适用于 2007 及更新的格式,并且使用起来并不简单。
如果性能不是问题,您可以使用 Word Automation,并让 Word 为您执行此操作。它看起来像这样:
var app = new Application();
var doc = app.Documents.Open(documentLocation);
string rangeText = doc.Range().Text;
doc.Save();
doc.Close();
Marshal.ReleaseComObject(doc);
Marshal.ReleaseComObject(app);
Run Code Online (Sandbox Code Playgroud)
请参阅http://www.codeproject.com/Articles/18703/Word-2007-Automation或http://www.codeproject.com/Articles/21247/Word-Automation了解更完整的示例和说明。请注意,如果您的文档非常复杂(脚注、文本框、表格...),这可能会变得更加棘手。
另一种选择是让 word 将文档保存为文本,然后读取文本文件。看看这个 - http://msdn.microsoft.com/en-us/library/microsoft.office.tools.word.document.saveas(v=vs.80).aspx