我正在将一些 html 转换为纯文本,并且我正在使用 jsoup 的HtmlToPlainText. 然而,在最近的 jsoup 版本中,不再包含该代码,因为据说它仅作为示例提供(尽管HtmlToPlainText javadoc仍然说它是 jsoup.jar 的一部分)。
除了手动复制或打包该代码作为附加库之外,我还可以使用什么来代替?jsoup 中是否有替代方案或至少基于 jsoup ?
我们最近从 JSoup 切换到 Jericho
return new Source(html).getRenderer().setMaxLineLength(Integer.MAX_VALUE).setNewLine(null).toString();
Run Code Online (Sandbox Code Playgroud)
有了这个 Maven 依赖
<dependency>
<groupId>net.htmlparser.jericho</groupId>
<artifactId>jericho-html</artifactId>
<version>3.4</version>
</dependency>
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1728 次 |
| 最近记录: |