相关疑难解决方法(0)

我有这个HTML:

<td class="0">
<b>Bold Text</b>&nbsp;
<a href=""></a>
</td>

<td class="0">
Regular Text&nbsp;
<a href=""></a>
</td>

哪个,用xpath格式化时...

new_html = tree.xpath('//td[@class="0"]/text() | //td[@class="0"]/b/text()')

打印:

['Bold Text', '', 'Regular Text']

如您所见,该 字符未被忽略,实际上被读作td中的额外条目.如何获得更好的输出？

3
推荐指数

1
解决办法

1458
查看次数