如何将Jsoup(Java html解析器)中生成的文档转换为字符串

Hud*_*hes 23 java html-parsing html-parser jsoup

我有一个jsoup中的文档,看起来像这样

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Run Code Online (Sandbox Code Playgroud)

我如何将其doc转换为字符串.

das*_*zul 36

你有没有尝试过:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();
Run Code Online (Sandbox Code Playgroud)

随着Document扩展Element,它还获得了根据API获取 "检索元素的内部HTML" 的方法html().这应该工作:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();
Run Code Online (Sandbox Code Playgroud)

附加信息:

每个Document对象都有一个对内部类Document.OutputSettings实例的引用,可以通过Document的outputSettings()方法访问它.在那里,您可以使用setter prettyPrint(true/false)启用/禁用漂亮打印.请参阅API 文档Document.OutputSettings为furtherinformation


Jer*_*man 8

doc.toString()和工作一样doc.outerHtml().

  • `Document.toString()` 内部调用了 `outerHtml()`。 (3认同)