这样的Unicode字符没有任何字节长度.重要的是字符编码.您可以根据编码的定义知道特定编码中字符的长度(以字节为单位).
例如,在ISO-8859-1(ISO Larin 1)编码中,它只编码一小部分Unicode,包括"®",每个字符长度为1个字节.
在UTF-16编码中,所有字符都是2或4个字节长,U + 0000 ... U + FFFF范围内的字符,例如"®",是2个字节
在UTF-32编码中,所有字符都是4个字节长.
在UTF-8编码中,字符占用1到4个字节.检查这个的一个简单方法是使用Fileformat.info 字符搜索(虽然这不是规范信息,只是一个很好的快速参考).例如,关于U + 00AE的页面显示了某些编码中的字符,包括UTF-8中的0xC2 0xAE(即2个字节).
| 归档时间: |
|
| 查看次数: |
720 次 |
| 最近记录: |