python字符串替换数字

Question

python字符串替换数字

我试图替换下面的字符串的某些部分.

'''<td align="center"> 5 </td> <td> align="center"> 0.0001 </td>'''

Run Code Online (Sandbox Code Playgroud)

<td>如果存在'0.'(decmial occurrence),我需要删除标签.即输出应该是

'''<td align="center"> 5 </td>'''

Run Code Online (Sandbox Code Playgroud)

我试过这个

data = ' '.join(data.split())<br>
l = data.replace('<td align="center"> 0.r"\d" </td>', "")

Run Code Online (Sandbox Code Playgroud)

但没有成功.谁能帮助我做这件事.

提前致谢

Answer 1

Kim*_*ais 11

虽然两个正则表达式示例都有效,但我建议不要使用正则表达式.

特别是如果数据是一个完整的html文档,你应该选择支持html的解析器,lxml.html例如:

from lxml import html
t = html.fromstring(text)
tds = t.xpath("table/tbody/tr[2]/td")
for td in tds:
    if tds.text.startswith("0."):
        td.getparent().remove(td)
text = html.tostring(t)

Run Code Online (Sandbox Code Playgroud)

归档时间：	13 年，11 月前
查看次数：	1732 次
最近记录：	13 年，11 月前