通过引用乔尔的文章
有些人误以为Unicode只是一个16位代码,每个字符占16位,因此有65,536个可能的字符.实际上,这不是正确的.
在阅读完整篇文章之后,我的观点是,如果有人告诉你,他的文字是unicode,你将不知道他的每个角色占用了多少内存空间.他必须告诉你,"我的unicode文本以UTF-8编码",然后只有你知道他的每个角色占用了多少内存空间.
Unicode =每个字符不需要2个字节
但是,当涉及Code Project的文章和微软的帮助时,这让我很困惑:
微软:
Unicode是一种16位字符编码,为所有语言提供足够的编码.所有ASCII字符都包含在Unicode中作为"加宽"字符.
代码项目:
Unicode字符集是一个"宽字符"(每个字符2个字节)集,包含每种语言中可用的每个字符,包括所有技术符号和特殊发布字符.多字节字符集(MBCS)每个字符使用1或2个字节
Unicode =每个字符2个字节?
65536个可能的角色是否能够代表这个世界上的所有语言?
为什么Web开发人员社区和桌面开发者社区中的概念看起来不同?