如何使用nodejs读取docx文件?

Wol*_*ley 6 view docx node.js electron

正如上面的标题。现在我正在制作一个电子应用程序,其功能是显示 docx 文件的内容,其中包括文字和图像。有谁知道nodejs库可以做到这一点?

Dar*_*ook 8

我已经多次提出这个问题了(所以很想听听你最终使用的是什么)。

我们使用了 Textract ( https://www.npmjs.com/package/textract )(注意。有一个 Python 包和一个 AWS 服务,具有相同的名称;它们都是不相关的。)它只是获取纯文本输出。它在某些格式上遇到了困难,尤其是 PDF。如果您还想要图像和格式,这并不是您真正想要的。

谷歌很快找到了这个列表: https://libraries.io/search?keywords=docx &languages=JavaScript

Mammoth ( https://github.com/mwilliamson/mammoth.js ) 正在积极开发中。请注意它描述的限制。然而,它生成 HTML 的事实将使您在 Electron 应用程序中的显示变得更加容易。

自从我上次搜索以来,LibreOffice-convert(https://github.com/elwerene/libreoffice-convert )对我来说是新的。利用 LibreOffice 听起来是一件明智的事情。它只是 LibreOffice 无头模式的简单包装。依赖关系使其不太适合 Electron 应用程序。

同样,您可以尝试 pandoc 的包装器(https://github.com/eshinn/node-pandoc