相关疑难解决方法(0)

lxml xpath不会忽略" "

我有这个HTML:

<td class="0">
<b>Bold Text</b>&nbsp;
<a href=""></a>
</td>

<td class="0">
Regular Text&nbsp;
<a href=""></a>
</td>
Run Code Online (Sandbox Code Playgroud)

哪个,用xpath格式化时...

new_html = tree.xpath('//td[@class="0"]/text() | //td[@class="0"]/b/text()')
Run Code Online (Sandbox Code Playgroud)

打印:

['Bold Text', '', 'Regular Text']
Run Code Online (Sandbox Code Playgroud)

如您所见,该&nbsp;字符未被忽略,实际上被读作td中的额外条目.如何获得更好的输出?

python xpath lxml

3
推荐指数
1
解决办法
1458
查看次数

标签 统计

lxml ×1

python ×1

xpath ×1