字符到字节

rlb*_*usa 0 byte character

找出X#characters = Y#bytes的好估计/转换/公式是什么?

Jon*_*eet 5

它完全取决于编码和潜在的数据.

对于UTF-16,如果您知道所有字符都在基本多语言平面中,则答案为bytes = 2*个字符.

对于UTF-8,如果所有内容都在ASCII范围内,则bytes = characters - 但如果有很多远东字符,则可能是bytes = 3*个字符(并且仍然假定为基本多语言平面).

其他编码显然有不同的场景.您能否提供有关您的情况(以及您的平台)的更多详细信息?您想要基于实际字符的准确计算值吗?你对要编码的文本有什么了解吗?