小编Jo *_* S.的帖子

jSoup从<span>类获取文本

我有一部分HTML文件,格式如下:

<h6 class="uiStreamMessage" data-ft="_____"> 
   <span class="messageBody" data-ft="____"> Welcome
   </span>
</h6>
Run Code Online (Sandbox Code Playgroud)

在该文件中,还有其他span类.但是我想获取所有'messageBody'的文本,只会插入到数据库中.

我试过了:

Elements links = doc.select("span.messageBody");
for (Element link : links) {
     message = link.text();
     // codes to insert into DB
}
Run Code Online (Sandbox Code Playgroud)

乃至

Elements links = doc.select("h6.uiStreamMessage span.messageBody");
Run Code Online (Sandbox Code Playgroud)

两者都不起作用.我找不到其他地方的任何解决方案.请帮忙.

**编辑

我已经意识到它是html文件中的嵌套范围:

<h6 class="uiStreamMessage" data-ft=""> 
   <span class="messageBody" data-ft="">Twisted<a href="http://"><span>http://</span>
   <span class="word_break"></span>www.tb.net/</a> Balloons
   </span>
</h6>
Run Code Online (Sandbox Code Playgroud)

并且有时候'messageBody'范围内还有另一个跨度.如何获取'messageBody'范围内的所有文本?

java parsing jsoup

4
推荐指数
2
解决办法
2万
查看次数

标签 统计

java ×1

jsoup ×1

parsing ×1