如何使用jsoup从html文件中提取文本

Adh*_*ham 5 html jsoup

我用过这段代码:

String innerHtml = Jsoup.parse(htmlCode,"ISO-8859-1").select("body").html();
Run Code Online (Sandbox Code Playgroud)

但它只删除<html>标签

遗嘱中的任何HTML标签body仍然会出现

Mat*_*ain 7

使用.text()而不是.html()获取元素及其所有子元素的组合文本.


Jam*_*lly 6

尝试使用.text():

Jsoup.parse(htmlCode,"ISO-8859-1").select("body").text();
Run Code Online (Sandbox Code Playgroud)

而不是.html().