如何使用Python替换HTML转义字符?

dan*_*007 7 python

可能重复:
解码Python字符串中的HTML实体?

我有一个字符串充满了HTML转义字符,如",”—.

任何Python库都提供了可靠的方法让我用它们各自的实际字符替换所有这些转义字符吗?

例如,我想用"s替换所有s.

Fra*_*llo 17

你想用这个:

try:
    from html.parser import HTMLParser  # Python 3
except ModuleNotFoundError:
    from HTMLParser import HTMLParser  # Python 2
parser = HTMLParser()
html_decoded_string = parser.unescape(html_encoded_string)
Run Code Online (Sandbox Code Playgroud)

我也看到了对BeautifulSoup的热爱

from BeautifulSoup import BeautifulSoup
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES)
Run Code Online (Sandbox Code Playgroud)

同样重复这些现有问题:

在Python字符串中解码HTML实体?

使用Python解码HTML实体

使用Python解码HTML实体

  • 如果您知道这是重复的,为什么不标记而不是回答(代表除外)? (2认同)
  • 当人们不花时间寻找他们问题的现有答案时,这很烦人,特别是在这种情况下 - 当有这么多精确的复制品时.但是,我觉得社区有时候会过度争吵.如果我们误解了这个问题并且它确实不重复怎么办?如果我回答这个问题会引发一个有意义的对话/话题,从而在不同的方向上提出问题和答案呢?一旦问题被关闭或删除与其相关的声誉可能被否定,它也不是真正的声誉... (2认同)