我有一个简单的问题-是什么样的区别UTF-8,UTF-16和UTF-32?我知道,编码字符串有不同的尺寸,但什么是UTF-16和UTF-32呢?Should't UTF-8能够正确地处理所有的语言?怎么UTF-7适合这个?
编辑
好吧,我比较了解整个事情的技术方面,但我仍然没有看到我应该使用的原因,UTF-16而不是UTF-8在我的应用程序中.所以我的问题是 - 其他编码的实际用法是什么UTF-8呢?
著名的 Joel Spolsky 的这篇文章对此进行了完美的解释:http://www.joelonsoftware.com/articles/Unicode.html
引用:
有数百种传统编码只能正确存储某些代码点,而将所有其他代码点更改为问号。一些流行的英语文本编码是 Windows-1252(西欧语言的 Windows 9x 标准)和 ISO-8859-1,又名 Latin-1(也适用于任何西欧语言)。但是尝试在这些编码中存储俄语或希伯来语字母,您会得到一堆问号。UTF 7、8、16 和 32 都具有能够正确存储任何代码点的良好特性。
| 归档时间: |
|
| 查看次数: |
4144 次 |
| 最近记录: |