是的,UTF-8 将 0x0 定义为NUL. 没有理由不能成为 UTF-8 流的一部分。RFC 3629 特别涵盖了这种情况:
从 U+0000 到 U+007F(US-ASCII 指令集)的字符编号对应于八位字节 00 到 7F(7 位 US-ASCII 值)。直接的结果是纯 ASCII 字符串也是有效的 UTF-8 字符串。
如您所知,有多种存储格式在编码方面存在问题NUL,因此修改后的 UTF-8 提供了替代编码,但“未修改”UTF-8 要求将其编码为 0x0(将其编码为 C0 80在第 10 节中明确指出为非法 UTF-8)。
| 归档时间: |
|
| 查看次数: |
5610 次 |
| 最近记录: |