Rob*_*ell 13 docx openxml xlsx apache-poi
2009年9月28日,Apache POI项目发布了3.5版本,正式支持Office 2007中引入的OOXML格式,如DOCX和XLSX.
请提供一个代码示例,用于以纯文本格式提取DOCX文件的内容,忽略任何样式或格式.
我问这个是因为我无法找到任何覆盖新OOXML支持的Apache POI示例.
小智 18
这对我有用.确保添加所需的罐子(升级xmlbeans等)
public String extractText(InputStream in) throws Exception {
    XWPFDocument doc = new XWPFDocument(in);
    XWPFWordExtractor ex = new XWPFWordExtractor(doc);
    String text = ex.getText();
    return text;
}
| 归档时间: | 
 | 
| 查看次数: | 14331 次 | 
| 最近记录: |