HtmlToPlainText 不再包含在 jsoup 中

adi*_*tsu 5 html java jsoup

我正在将一些 html 转换为纯文本,并且我正在使用 jsoup 的HtmlToPlainText. 然而,在最近的 jsoup 版本中,不再包含该代码,因为据说它仅作为示例提供(尽管HtmlToPlainText javadoc仍然说它是 jsoup.jar 的一部分)。

除了手动复制或打包该代码作为附加库之外,我还可以使用什么来代替?jsoup 中是否有替代方案或至少基于 jsoup ?

Joh*_*rin 3

我们最近从 JSoup 切换到 Jericho

return new Source(html).getRenderer().setMaxLineLength(Integer.MAX_VALUE).setNewLine(null).toString();
Run Code Online (Sandbox Code Playgroud)

有了这个 Maven 依赖

<dependency>
    <groupId>net.htmlparser.jericho</groupId>
    <artifactId>jericho-html</artifactId>
    <version>3.4</version>
</dependency>
Run Code Online (Sandbox Code Playgroud)