fun*_*guy 3 python regex string replace
我试图替换下面的字符串的某些部分.
'''<td align="center"> 5 </td> <td> align="center"> 0.0001 </td>'''
Run Code Online (Sandbox Code Playgroud)
<td>如果存在'0.'(decmial occurrence),我需要删除标签.即输出应该是
'''<td align="center"> 5 </td>'''
Run Code Online (Sandbox Code Playgroud)
我试过这个
data = ' '.join(data.split())<br>
l = data.replace('<td align="center"> 0.r"\d" </td>', "")
Run Code Online (Sandbox Code Playgroud)
但没有成功.谁能帮助我做这件事.
提前致谢
Kim*_*ais 11
虽然两个正则表达式示例都有效,但我建议不要使用正则表达式.
特别是如果数据是一个完整的html文档,你应该选择支持html的解析器,lxml.html例如:
from lxml import html
t = html.fromstring(text)
tds = t.xpath("table/tbody/tr[2]/td")
for td in tds:
if tds.text.startswith("0."):
td.getparent().remove(td)
text = html.tostring(t)
Run Code Online (Sandbox Code Playgroud)