用文本替换 HTML 链接

Evg*_*Evg 3 html python parsing text-parsing

如何用html(python)中的锚替换链接?

例如输入:

 <p> Hello <a href="http://example.com">link text1</a> and <a href="http://example.com">link text2</a> ! </p>
Run Code Online (Sandbox Code Playgroud)

我想要保存 p 标签的结果(只是一个标签删除):

<p>
Hello link text1 and link text2 ! 
</p>
Run Code Online (Sandbox Code Playgroud)

mii*_*lek 5

你可以用一个简单的正则表达式和sub函数来做到这一点:

import re

text = '<p> Hello <a href="http://example.com">link text1</a> and <a href="http://example.com">link text2</a> ! </p>'
pattern =r'<(a|/a).*?>'

result = re.sub(pattern , "", text)

print result
'<p> Hello link text1 and link text2 ! </p>'
Run Code Online (Sandbox Code Playgroud)

此代码用空字符串替换所有出现的<a..></a>标签。