如何通过编程方式使用AcroTextExtractor.exe?

Mar*_*ala 7 adobe-reader

我正在尝试从PDF文件中提取批量文本.尝试过许多库和Adobe Reader对我来说似乎是最准确的文本提取器.

我注意到安装了Adobe Reader的文件夹中的文件AcroTextExtractor.exe.sname看起来很有希望,谷歌搜索它们显示这个文件是PDF到文本转换例程的一部分.

如何从命令行调用此文件来进行文本提取?

小智 1

我也想在相同的场景中使用它。

我做了一个实验,看看是否可以检查启动AcroTextExtractor.exe.

我拿了一个大 PDF 并在 Adob​​e Acrobat Reader DC 版本 2018.009.20050 中打开它。然后,我将其保存为文本(文件 | 另存为其他 | 文本),当 Reader 生成文本文件(成功)时,我检查了任务管理器、sysinternals Process Explorer 中的所有正在运行的进程,以及 Powershell 中的 WMI。

不幸的是,我找不到使用路径启动的进程,包括AcroTextExtractor.exe;因此我无法获取命令行。

这很可能是一个转移注意力的事情。