如何使用Jsoup获取此文本?

wil*_*nux 5 java css-selectors html-parsing jsoup

如何使用Jsoup从以下html代码中获取"this text"?

<h2 class="link title"><a href="myhref.html">this text<img width=10 
        height=10 src="img.jpg" /><span class="blah">
        <span>Other texts</span><span class="sometime">00:00</span></span>
        </a></h2>
Run Code Online (Sandbox Code Playgroud)

当我尝试

String s = document.select("h2.title").select("a[href]").first().text();
Run Code Online (Sandbox Code Playgroud)

它返回

本文其他文本00:00

我试着在Jsoup中读取Selector的api 但是想不通多了.

另外我如何获得类的元素class="link title blah"(多个类?).原谅我,我只知道Jsoup和CSS.

Bal*_*usC 9

Element#ownText()而不是Element#text().

String s = document.select("h2.link.title a[href]").first().ownText();
Run Code Online (Sandbox Code Playgroud)

请注意,您可以通过只串联的类名选择在一起,就像是选择多类元素h2.link.title,这将挑选<h2>其中至少有元素linktitle类.