小编Bil*_*lly的帖子

使用jsoup将html转换为纯文本时如何保留换行符?

我有以下代码:

 public class NewClass {
     public String noTags(String str){
         return Jsoup.parse(str).text();
     }


     public static void main(String args[]) {
         String strings="<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN \">" +
         "<HTML> <HEAD> <TITLE></TITLE> <style>body{ font-size: 12px;font-family: verdana, arial, helvetica, sans-serif;}</style> </HEAD> <BODY><p><b>hello world</b></p><p><br><b>yo</b> <a href=\"http://google.com\">googlez</a></p></BODY> </HTML> ";

         NewClass text = new NewClass();
         System.out.println((text.noTags(strings)));
}
Run Code Online (Sandbox Code Playgroud)

我有结果:

hello world yo googlez
Run Code Online (Sandbox Code Playgroud)

但我想打破界限:

hello world
yo googlez
Run Code Online (Sandbox Code Playgroud)

我查看了jsoup的TextNode#getWholeText()但我无法弄清楚如何使用它.

如果<br>我解析了标记中的a ,那么如何在结果输出中获得换行符?

java jsoup

95
推荐指数
9
解决办法
5万
查看次数

标签 统计

java ×1

jsoup ×1