如何从JSoup'Document'中删除不间断的空格?

Nic*_*her 6 html java html-entities jsoup

我该如何删除这些:

<td>&nbsp;</td>
Run Code Online (Sandbox Code Playgroud)

要么

<td width="7%">&nbsp;</td>
Run Code Online (Sandbox Code Playgroud)

来自我的JSoup'文档'?我尝试了很多方法,但是这些不间断的空格字符与普通的JSoup表达式或选择器不匹配.

Bal*_*usC 13

Java 实体&nbsp;(Unicode字符NO-BREAK SPACE U + 00A0)可以用Java表示\u00a0.假设您要删除包含该字符的每个元素作为自己的文本(因此不是您在评论中所说的每一),那么以下应该有效:

document.select(":containsOwn(\u00a0)").remove();
Run Code Online (Sandbox Code Playgroud)

如果你真的想删除整行,那么你最好的选择就是逐行扫描HTML.