用Python 2.6中的相应utf-8字符替换html实体

Ale*_*dru 13 python python-2.6 html-entities

我有一个像这样的HTML文本:

<xml ... >
Run Code Online (Sandbox Code Playgroud)

我想把它转换成可读的东西:

<xml ...>
Run Code Online (Sandbox Code Playgroud)

用Python做任何简单(快速)的方法吗?

var*_*tec 22

Python 2.7

官方文档HTMLParser:Python 2.7

>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('&copy; &euro;')
u'\xa9 \u20ac'
>>> print _
© €
Run Code Online (Sandbox Code Playgroud)

Python 3

官方文档HTMLParser:Python 3

>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('&copy; &euro;')
© €
Run Code Online (Sandbox Code Playgroud)

  • -1因为:"自2.6版本后弃用" (2认同)