我有一部分HTML文件,格式如下:
<h6 class="uiStreamMessage" data-ft="_____">
<span class="messageBody" data-ft="____"> Welcome
</span>
</h6>
Run Code Online (Sandbox Code Playgroud)
在该文件中,还有其他span类.但是我想获取所有'messageBody'的文本,只会插入到数据库中.
我试过了:
Elements links = doc.select("span.messageBody");
for (Element link : links) {
message = link.text();
// codes to insert into DB
}
Run Code Online (Sandbox Code Playgroud)
乃至
Elements links = doc.select("h6.uiStreamMessage span.messageBody");
Run Code Online (Sandbox Code Playgroud)
两者都不起作用.我找不到其他地方的任何解决方案.请帮忙.
**编辑
我已经意识到它是html文件中的嵌套范围:
<h6 class="uiStreamMessage" data-ft="">
<span class="messageBody" data-ft="">Twisted<a href="http://"><span>http://</span>
<span class="word_break"></span>www.tb.net/</a> Balloons
</span>
</h6>
Run Code Online (Sandbox Code Playgroud)
并且有时候'messageBody'范围内还有另一个跨度.如何获取'messageBody'范围内的所有文本?