文件大小采用UTF-8编码?

Ran*_*ana 8 utf-8

我创建了一个UTF-8编码的文件,但我不明白磁盘占用大小的规则.这是我的完整研究:

  1. 首先,我使用单个印地语字母"क"创建了该文件,Windows 7上的文件大小为
    8个字节.

  2. 现在有两个字母'कक',文件大小为11个字节.

  3. 现在有三个字母'ककक',文件大小为14个字节.

有人可以解释一下为什么它会显示这样的尺寸吗?

Tim*_*ker 7

前三个字节用于BOM(字节顺序标记) EF BB BF.

然后,字节E0 A4 95编码字母क.

然后字节0D 0A编码一个回车符.

总计:8个字节.对于您添加的每个字母,您需要三个字节.