从转义的html - >到常规的html? - Python

Rad*_*Hex 6 html python lxml escaping beautifulsoup

我使用BeautifulSoup来处理我通过REST API收集的XML文件.

响应包含HTML代码,但BeautifulSoup可以转义所有HTML标记,因此可以很好地显示.

不幸的是我需要HTML代码.


我将如何继续将转义的HTML转换为正确的标记?


非常感谢帮助!

Ale*_*lli 13

我想你想从Python标准库中获取xml.sax.saxutils.unescape.

例如:

>>> from xml.sax import saxutils as su
>>> s = '<foo>bar</foo>'
>>> su.unescape(s)
'<foo>bar</foo>'
Run Code Online (Sandbox Code Playgroud)

  • 不幸的是它不能处理所有字符.例如,``su.unescape('&quot;')``不起作用. (3认同)
  • 您可以通过在字典中将其他字符指定为“unes​​cape”的第二个参数来转义它们。例如: `su.unescape(s, {'"':'"'})` (2认同)