wil*_*nux 5 java css-selectors html-parsing jsoup
如何使用Jsoup从以下html代码中获取"this text"?
<h2 class="link title"><a href="myhref.html">this text<img width=10
height=10 src="img.jpg" /><span class="blah">
<span>Other texts</span><span class="sometime">00:00</span></span>
</a></h2>
Run Code Online (Sandbox Code Playgroud)
当我尝试
String s = document.select("h2.title").select("a[href]").first().text();
Run Code Online (Sandbox Code Playgroud)
它返回
本文其他文本00:00
我试着在Jsoup中读取Selector的api 但是想不通多了.
另外我如何获得类的元素class="link title blah"(多个类?).原谅我,我只知道Jsoup和CSS.
用Element#ownText()而不是Element#text().
String s = document.select("h2.link.title a[href]").first().ownText();
Run Code Online (Sandbox Code Playgroud)
请注意,您可以通过只串联的类名选择在一起,就像是选择多类元素h2.link.title,这将挑选<h2>其中至少有元素都在link和title类.