Chr*_*rdt 10
UTF-32
已经开始作为一个子集UCS-4
.现在它是相同的,只是UTF-32标准有额外的Unicode语义.查看维基百科的详细信息:
原始的ISO 10646标准定义了一种称为UCS-4的31位编码形式,其中通用字符集(UCS)中的每个编码字符由0和十六进制之间的整数的代码空间中的32位友好代码值表示. 7FFFFFFF.
由于实际上只使用了17个平面,因此所有当前代码点都在0到0x10FFFF之间.UTF-32是UCS-4的子集,仅使用此范围.由于JTC1/SC2/WG2的原则和程序文件规定所有未来的字符分配将限制在BMP或前14个补充平面,UTF-32将能够代表所有Unicode字符.因此,UCS-4和UTF-32现在完全相同,只是UTF-32标准具有额外的Unicode语义.
但是,我不完全确定,additional Unicode semantics
意味着什么.也许有人可以提供更好的答案.
归档时间: |
|
查看次数: |
5802 次 |
最近记录: |