如何转换":"之类的字符 到python中的":"?

Sha*_*ane 3 python character-encoding special-characters

可能重复:
在Python中将XML/HTML实体转换为Unicode字符串

在HTML源代码中,有很多字符如":" 或"." (必须在&#和数字之间放置空格或者这些字符将被视为":"或"."),我的问题是,你如何将它们转换为他们应该在python中的内容?有内置方法还是什么?

希望有人可以帮助我.谢谢

YOU*_*YOU 5

我不确定是否有内置库,但这里有快速和脏的方式来处理正则表达式

>>> import re
>>> re.sub("&#(\d+);",lambda x:unichr(int(x.group(1),10)),": or .")
u': or .'
Run Code Online (Sandbox Code Playgroud)