Top*_*der 19 unicode utf-8 character-encoding cjk
有人可以确认所有汉字中的汉字字符都是3字节长的UTF-8吗?
dan*_*n04 27
常用的汉字/汉字字符位于U + 4E00和U + 9FFF之间的"CJK统一表意文字"块中,并采用UTF-8中的3个字节.(日语平假名和片假名字符也需要3个字节.)
但是,"CJK统一表意文字扩展B"和"CJK兼容表意文字补充"块中也有一些很少使用的字符,它们采用UTF-8中的4个字节.
另请注意,中文文本通常包含数字0-9等ASCII字符.