我要求解释Unicode中所有可能有效组合的计数.我知道char可以编码为1,2,3或4个字节.我也不明白为什么延续字节有限制,即使该字符的起始字节清除它应该有多长.
好的.我知道这看起来像典型的"为什么他不只是谷歌它或去www.unicode.org并查找它?" 问题,但对于这样一个简单的问题,在检查了两个来源之后,答案仍然存在.
我很确定所有这三种编码系统都支持所有Unicode字符,但我需要在演示文稿中声明之前确认它.
奖金问题:这些编码在可以扩展到支持的字符数量方面是否有所不同?
当前版本的UTF-16只能编码1,112,064个不同的数字(代码点);0x0-0x10FFFF。
Unicode联合会打算使UTF-16用完字符吗?
即设定一个代码点> 0x10FFFF
如果不是,为什么有人会为utf-8解析器编写代码,使其能够接受5个或6个字节的序列?因为这会在其功能中添加不必要的指令。
1,112,064还不够,我们实际上需要更多字符吗?我的意思是:我们快用完了吗?
我想检查一个大数字是否是有效的 Unicode 字符。我查看了该Char.IsSymbol(char)函数,但它需要一个字符作为输入。我需要的是相当于Char.IsSymbol(int). 例如:Char.IsSymbol(340813);