如何将字节列表(unicode)转换为Python字符串?

Bar*_*cik 7 python string unicode

我有一个字节列表(8位字节,或者用C/C++语言形成wchar_t类型字符串),它们形成一个UNICODE字符串(逐字节),如何将这些值转换为Python字符串,尝试了一些事情,但没有人可以将这2个字节加入1个字符并从中构建一个完整的字符串.谢谢.

Lev*_*sky 13

将字节序列转换为Unicode字符串是通过调用该decode()方法str(在Python 2.x中)或bytes(Python 3.x)对象来完成的.

如果你实际上有一个字节列表,那么,为了得到这个对象,你可以使用 ''.join(bytelist)b''.join(bytelist).

您需要指定用于编码原始Unicode字符串的编码.

但是,术语"Python字符串"有点模糊,也与版本有关.Python str类型代表Python 2.x中的字节字符串和Python 3.x中的Unicode字符串.所以,在Python 2中,只是做''.join(bytelist)就会给你一个str对象.

Python 2的演示:

In [1]: '????'
Out[1]: '\xd1\x82\xd0\xb5\xd1\x81\xd1\x82'

In [2]: bytelist = ['\xd1', '\x82', '\xd0', '\xb5', '\xd1', '\x81', '\xd1', '\x82']

In [3]: ''.join(bytelist).decode('utf-8')
Out[3]: u'\u0442\u0435\u0441\u0442'

In [4]: print ''.join(bytelist).decode('utf-8') # encodes to the terminal encoding
????

In [5]: ''.join(bytelist) == '????'
Out[5]: True
Run Code Online (Sandbox Code Playgroud)


小智 8

您还可以使用将字节列表转换为字符串列表 decode()

stringlist=[x.decode('utf-8') for x in bytelist]
Run Code Online (Sandbox Code Playgroud)