如何将Jsoup(Java html解析器)中生成的文档转换为字符串

Question

如何将Jsoup(Java html解析器)中生成的文档转换为字符串

Hud*_*hes 23 java html-parsing html-parser jsoup

我有一个jsoup中的文档,看起来像这样

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

Run Code Online (Sandbox Code Playgroud)

我如何将其doc转换为字符串.

Answer 1

das*_*zul 36

你有没有尝试过:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

Run Code Online (Sandbox Code Playgroud)

随着Document扩展Element,它还获得了根据API获取 "检索元素的内部HTML" 的方法html().这应该工作:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

Run Code Online (Sandbox Code Playgroud)

附加信息:

每个Document对象都有一个对内部类Document.OutputSettings实例的引用,可以通过Document的outputSettings()方法访问它.在那里,您可以使用setter prettyPrint(true/false)启用/禁用漂亮打印.请参阅API 文档和Document.OutputSettings为furtherinformation

Answer 2

Jer*_*man 8

doc.toString()和工作一样doc.outerHtml().

`Document.toString()` 内部调用了 `outerHtml()`。 (3认同)

归档时间：	14 年，7 月前
查看次数：	22745 次
最近记录：	7 年，1 月前