使用jsoup获取标记后的某些文本

Yod*_*066 5 html tags text jsoup

嗨,我想尝试使用jsoup从HTML文件中获取某些文本.我已经知道如何获取text2和text3.但是如何在没有其他人的情况下获得我想要的文字

<div class="snt"> text I want  
<br clear="both" />text2  
<br clear="both" />text3  
<br clear="both" />  
</div>    
Run Code Online (Sandbox Code Playgroud)

我试着用

Elements lines = doc.select(".snt");
lines.First().nextSibling().toString();    
Run Code Online (Sandbox Code Playgroud)

但我一无所获.我也尝试过:

Elements lines = doc.select(".snt");  
lines.text(); // this return all texts together       
Run Code Online (Sandbox Code Playgroud)

你能帮我么?谢谢您的回答.

use*_*883 3

如果您尝试使用 ownText() 作为第一个元素,您将得到“text I Want text2 text3”,这是正确的。您需要 br 之前的文本,这是第一个元素下的第一个子节点。Jsoup 将文本作为节点处理。

Elements lines = doc.select(".snt");
System.out.println(lines.first().childNodes().get(0));
Run Code Online (Sandbox Code Playgroud)