使用 pdftohtml poppler 实用程序将多页 PDF 转换为单个 html 文件

Dee*_*ade 3 poppler pdf-to-html pdf-parsing

我正在使用 poppler 实用程序将 PDF 文档转换为 HTML。但它为每个页面创建单独的 html 文件,但在将 pdf 转换为 html 后我想要一个单独的 HTML 文件。

我使用了以下语法:

pdftohtml -c abc.pdf
Run Code Online (Sandbox Code Playgroud)

但它创建了 abc-1.html、abc-2.html、.... 等

我也尝试过 pdftohtml -c abc.pdf abc.html但没有得到预期的输出。

谁能告诉如何在单个文件而不是多个 html 文件中获取 html 输出?

Dee*_*ade 5

我已经用 -s 选项实现了这一点

例如:

pdftohtml -c -s -noframes abc.pdf abc.html
Run Code Online (Sandbox Code Playgroud)