Yod*_*066 5 html tags text jsoup
嗨,我想尝试使用jsoup从HTML文件中获取某些文本.我已经知道如何获取text2和text3.但是如何在没有其他人的情况下获得我想要的文字
<div class="snt"> text I want
<br clear="both" />text2
<br clear="both" />text3
<br clear="both" />
</div>
Run Code Online (Sandbox Code Playgroud)
我试着用
Elements lines = doc.select(".snt");
lines.First().nextSibling().toString();
Run Code Online (Sandbox Code Playgroud)
但我一无所获.我也尝试过:
Elements lines = doc.select(".snt");
lines.text(); // this return all texts together
Run Code Online (Sandbox Code Playgroud)
你能帮我么?谢谢您的回答.
如果您尝试使用 ownText() 作为第一个元素,您将得到“text I Want text2 text3”,这是正确的。您需要 br 之前的文本,这是第一个元素下的第一个子节点。Jsoup 将文本作为节点处理。
Elements lines = doc.select(".snt");
System.out.println(lines.first().childNodes().get(0));
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2223 次 |
| 最近记录: |