Evg*_*Evg 3 html python parsing text-parsing
如何用html(python)中的锚替换链接?
例如输入:
<p> Hello <a href="http://example.com">link text1</a> and <a href="http://example.com">link text2</a> ! </p>
Run Code Online (Sandbox Code Playgroud)
我想要保存 p 标签的结果(只是一个标签删除):
<p>
Hello link text1 and link text2 !
</p>
Run Code Online (Sandbox Code Playgroud)
你可以用一个简单的正则表达式和sub函数来做到这一点:
import re
text = '<p> Hello <a href="http://example.com">link text1</a> and <a href="http://example.com">link text2</a> ! </p>'
pattern =r'<(a|/a).*?>'
result = re.sub(pattern , "", text)
print result
'<p> Hello link text1 and link text2 ! </p>'
Run Code Online (Sandbox Code Playgroud)
此代码用空字符串替换所有出现的<a..>和</a>标签。