mag*_*nus 0 c c++ unicode file-format
我正在设计一种简单的文件格式,我正在考虑支持 UTF8,而不是仅支持扩展的 US ASCII。
换行字节(十六进制 0x0A)是分隔符之一。这个字节序列是否可以嵌入到多字节UTF8序列中?例如,其中初始字节之一具有高位设置(表示多字节字符),而尾随字节之一是 0x0A?
nne*_*neo 5
请查看UTF-8规范。所有值 <= 0x7F 的字节都被视为该代码点;多字节序列中的所有字节都设置为高位。
归档时间:
8 年,9 月 前
查看次数:
554 次
最近记录: