如何从 pdfBox 导入 ImageIOUtil 和 PDFText2HTML 类

Yai*_*ann 0 java maven pdfbox

我正在尝试获取远程 pdf 文件并对其执行一些操作。为此,我使用 PDFBox。我无法获取工具包来导入 ImageIOUtil 和 PDFText2HTML

我在搜索网络后通过 Maven 依赖项添加了 pdfbox 2.0.6 我尝试将其更改为 2.0.7 和 2.0.5

我使用的位置:

导入 org.apache.pdfbox.tools.PDFText2HTML;

导入 org.apache.pdfbox.tools.imageio.ImageIOUtil;

此处的 Javadoc 中指定了这些: https://pdfbox.apache.org/docs/2.0.5/javadocs/org/apache/pdfbox/tools/imageio/ImageIOUtil.html https://pdfbox.apache.org/docs /2.0.7/javadocs/org/apache/pdfbox/tools/PDFText2HTML.html

但我得到“无法解析符号“工具””

我的pom:

<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>pdfbox</artifactId>
  <version>2.0.7</version>
</dependency>
<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>fontbox</artifactId>
  <version>2.0.7</version>
</dependency>
Run Code Online (Sandbox Code Playgroud)

我的班级进口:

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.tools.imageio.ImageIOUtil;
import org.apache.pdfbox.tools.PDFText2HTML;
import org.apache.pdfbox.text.PDFTextStripper;
Run Code Online (Sandbox Code Playgroud)

Til*_*err 5

使用 pdfbox 工具:

<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>pdfbox-tools</artifactId>
  <version>2.0.15</version>
</dependency>
Run Code Online (Sandbox Code Playgroud)

并将所有内容(还有 pdfbox 和 fontbox)更新到当前版本,即 2.0.15。修复了许多错误(包括一些安全问题)并进行了改进。