如何在HTML标记中选择文本而不在其周围添加标记(JSoup)

Fer*_*erb 4 html java dom jsoup

我想在strong-tag中选择文本,但不包含div ...

是否有可能直接使用jsoup?

我尝试选择(不起作用,选择strong-tag内的完整内容):

Elements selection = htmlDocument.select("strong").select("*:not(.dontwantthatclass)");
Run Code Online (Sandbox Code Playgroud)

HTML:

<strong>
   I want that text
   <div class="dontwantthatclass">
   </div>
</strong>
Run Code Online (Sandbox Code Playgroud)

小智 7

您正在寻找ownText()方法.

String txt = htmlDocument.select("strong").first().ownText();
Run Code Online (Sandbox Code Playgroud)