Ran*_*ana 8 utf-8
我创建了一个UTF-8编码的文件,但我不明白磁盘占用大小的规则.这是我的完整研究:
首先,我使用单个印地语字母"क"创建了该文件,Windows 7上的文件大小为 8个字节.
现在有两个字母'कक',文件大小为11个字节.
现在有三个字母'ककक',文件大小为14个字节.
有人可以解释一下为什么它会显示这样的尺寸吗?
Tim*_*ker 7
前三个字节用于BOM(字节顺序标记) EF BB BF.
EF BB BF
然后,字节E0 A4 95编码字母क.
E0 A4 95
然后字节0D 0A编码一个回车符.
0D 0A
总计:8个字节.对于您添加的每个字母,您需要三个字节.
归档时间:
11 年,7 月 前
查看次数:
904 次
最近记录: