W3C推荐使用UTF-8,因为它是一种可识别的编码 - 声称为UTF-8的文本可以这样验证(具有很高的概率).
UTF-8还可以无损编码所有unicode代码点.这与ISO-8859-1(又名拉丁语-1)形成鲜明对比,后者只能编码低于256的代码点.
有一些权衡取舍.Latin-1紧凑地表示每个字符一个字节的大多数欧洲文本.并且,Latin-1是可索引的(即第五个字符位于第五个字节偏移处),而UTF-8是可变长度(需要顺序访问).
| 归档时间: |
|
| 查看次数: |
87 次 |
| 最近记录: |