python获取unicode字符串大小

Nic*_*ick 18 python binaryfiles utf-8

我有一个二进制文件.该文件包含UTF-8字符串.此外,保证这个字符串只是一个单词.在python中,如何获得此字符串中的字母数?

比方说,我打开这个文件并读取字节:

bytes = open("1.dat", "rb").read()
Run Code Online (Sandbox Code Playgroud)

接下来我要做些什么来找出UTF-8字符串的长度(字母,而不是字节)?

Håv*_*ard 34

unicode_string = bytes.decode("utf-8")
print len(unicode_string)
Run Code Online (Sandbox Code Playgroud)

  • 在Python 3中,你可以设置`bytes = len(open('1.dat',encoding ='utf-8').read())` (2认同)