我有这个HTML:
<td class="0">
<b>Bold Text</b>
<a href=""></a>
</td>
<td class="0">
Regular Text
<a href=""></a>
</td>
Run Code Online (Sandbox Code Playgroud)
哪个,用xpath格式化时...
new_html = tree.xpath('//td[@class="0"]/text() | //td[@class="0"]/b/text()')
Run Code Online (Sandbox Code Playgroud)
打印:
['Bold Text', '', 'Regular Text']
Run Code Online (Sandbox Code Playgroud)
如您所见,该 字符未被忽略,实际上被读作td中的额外条目.如何获得更好的输出?