Mar*_*ers 14
您需要知道要测量字节大小的编码:
>>> print u'\uC815\uC815'
??
>>> print len(u'\uC815\uC815')
2
>>> print len(u'\uC815\uC815'.encode('UTF-8'))
6
>>> print len(u'\uC815\uC815'.encode('UTF-16-LE'))
4
>>> print len(u'\uC815\uC815'.encode('UTF-16'))
6
>>> print len(u'\uC815\uC815'.encode('UTF-32-LE'))
8
>>> print len(u'\uC815\uC815'.encode('UTF-32'))
12
Run Code Online (Sandbox Code Playgroud)
您真的想要查看Python Unicode HOWTO以充分理解unicode对象与其字节编码之间的区别.
另一篇优秀的文章是Joel Spolsky(Stack Overflow背后的人之一)绝对必须知道关于Unicode和字符集(没有借口!)的绝对最低每个软件开发人员.
| 归档时间: |
|
| 查看次数: |
1920 次 |
| 最近记录: |