可能重复:
解码Python字符串中的HTML实体?
我有一个字符串充满了HTML转义字符,如",”和—.
任何Python库都提供了可靠的方法让我用它们各自的实际字符替换所有这些转义字符吗?
例如,我想用"s替换所有s.
Fra*_*llo 17
你想用这个:
try:
from html.parser import HTMLParser # Python 3
except ModuleNotFoundError:
from HTMLParser import HTMLParser # Python 2
parser = HTMLParser()
html_decoded_string = parser.unescape(html_encoded_string)
Run Code Online (Sandbox Code Playgroud)
我也看到了对BeautifulSoup的热爱
from BeautifulSoup import BeautifulSoup
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES)
Run Code Online (Sandbox Code Playgroud)
同样重复这些现有问题:
| 归档时间: |
|
| 查看次数: |
15084 次 |
| 最近记录: |