将数字字符引用表示法转换为unicode字符串

Ada*_*tan 6 python unicode encoding

是否有标准,最好是Pythonic,将&#xxxx;符号转换为正确的unicode字符串?

例如,

מפגשי
Run Code Online (Sandbox Code Playgroud)

应转换为:

?????
Run Code Online (Sandbox Code Playgroud)

它可以很容易地完成 - 使用字符串操作,但我想知道是否有一个标准的库.

Ter*_*ryA 9

用途HTMLParser.HTMLParser():

>>> from HTMLParser import HTMLParser
>>> h = HTMLParser()
>>> s = "מפגשי"
>>> print h.unescape(s)
?????
Run Code Online (Sandbox Code Playgroud)

它也是标准库的一部分.


但是,如果您使用的是Python 3,则必须从html.parser以下位置导入:

>>> from html.parser import HTMLParser
>>> h = HTMLParser()
>>> s = 'מפגשי'
>>> print(h.unescape(s))
?????
Run Code Online (Sandbox Code Playgroud)