相关疑难解决方法(0)

在没有Microsoft.Office.Interop的情况下,将.NET doc和docx格式转换为.NET Core中的PDF

我需要在浏览器中显示Word .doc.docx文件.没有真正的客户端方式,出于法律原因,这些文档无法与Google文档或Microsoft Office 365共享.

浏览器无法显示Word,但可以显示PDF,因此我想在服务器上将这些文档转换为PDF然后显示.

我知道这可以使用Microsoft.Office.Interop.Word,但我的应用程序是.NET Core,并且无法访问Office互操作.它可以在Azure上运行,但它也可以在Docker容器中运行.

似乎有很多类似的问题,但大多数人都在询问全框架.NET或假设服务器是Windows操作系统,任何答案对我都没用.

如何转换.doc.docx文件.pdf 无法访问Microsoft.Office.Interop.Word

c# pdf ms-word .net-core

39
推荐指数
5
解决办法
3万
查看次数

在 R 中读取和扫描 MS Word .doc 文件

我有一大堆 .doc 文件,它们提供了一组相应数据集中可用的变量。我想在 R 中扫描这些数据,看看哪些数据集包含感兴趣的变量。我之前已经使用 readLines 在纯文本文件上完成了此操作,但这不适用于 .doc 文件。

我已经下载了 tm 包,它应该能够使用 readDOC 命令读取 .doc 文件,但说明非常有限,我无法让它工作。有谁知道如何使用 readDOC 命令或对如何在 R 中执行此操作有其他建议?谢谢!

非常感谢大家的回复和建议。我认为 R 可以很容易地设置为读取 .doc 文件,但根据你所说的,我认为最简单的事情是首先将所有 word 文件转换为另一种格式。我刚刚下载了一些名为“Convert Doc”的免费软件,我将所有 Word 文档存储在一个文件夹中,并很快将它们全部转换为 .txt 文件。现在我可以自动执行搜索,因为我有大约 100 个数据文件以及指定变量编码的随附 Word 文档,每个数据文件中的变量编码并不总是相同(例如,对于是/否,一些使用 0/1,其他使用 1/2)因此,这使我能够找到正确的变量并使用 readLines、grep 和更多的文本处理来存储其编码。谢谢!

r ms-word

2
推荐指数
1
解决办法
4694
查看次数

标签 统计

ms-word ×2

.net-core ×1

c# ×1

pdf ×1

r ×1