python - 可能的编码和解码值

tom*_*mes 0 python unicode

我正在尝试解码以下列方式编码的聊天节目:
&#number;
我试过了:

 s.decode("utf8")
Run Code Online (Sandbox Code Playgroud)

和:

 s.decode("unicode-escape")
Run Code Online (Sandbox Code Playgroud)

但两者似乎都不起作用.

我应该使用什么编码来解码这种类型?

一般来说 - 我在哪里可以找到所有有效编码的列表?

Tor*_*xed 5

Python 2:

import HTMLParser
h = HTMLParser.HTMLParser()
print h.unescape('£682m')
£682m
Run Code Online (Sandbox Code Playgroud)

Python 3:

import html.parser
h = html.parser.HTMLParser()
print(h.unescape('£682m'))
£682m
Run Code Online (Sandbox Code Playgroud)

.encode和.decode以一种不同的方式工作,然后你会发现我害怕.请参阅以下内容:

print 'å'.decode('iso-8859-1')
u'\x86'
Run Code Online (Sandbox Code Playgroud)

当我将它输入控制台(å)时,字符串在latin-1中编码,但我的终点使用iso-8859-1,所以我可以重新编码它以适合我的端点的字符编码.

有关字符编码的更多信息:http://en.wikipedia.org/wiki/Character_encoding