从转义的html - >到常规的html？ - Python

Question

我使用BeautifulSoup来处理我通过REST API收集的XML文件.

响应包含HTML代码,但BeautifulSoup可以转义所有HTML标记,因此可以很好地显示.

不幸的是我需要HTML代码.

我将如何继续将转义的HTML转换为正确的标记？

非常感谢帮助!

Answer 1

我想你想从Python标准库中获取xml.sax.saxutils.unescape.

例如:

>>> from xml.sax import saxutils as su
>>> s = '&lt;foo&gt;bar&lt;/foo&gt;'
>>> su.unescape(s)
'<foo>bar</foo>'