记事本中的Unicode文件

FSm*_*FSm 21 unicode unicode-string

在记事本中将文本文件另存为"Unicode"时,这意味着什么?它是Utf-8,Utf-16还是Utf-32?提前致谢.

Juk*_*ela 31

在记事本中,与Windows软件一样,"Unicode"作为编码名称表示UTF-16 Little Endian(UTF-16LE).(我首先认为它不是真正的UTF-16,因为Notepad ++将其识别为UCS-2并将内容显示为垃圾,但是使用BabelPad重新检查,我得出结论,记事本甚至可以正确编码非BMP字符.)

同样,"Unicode big endian"表示UTF-16 Big Endian."ANSI"表示系统的本机遗留编码,例如西方版Windows中的8位windows-1252编码.

  • UTF-16和UTF-8覆盖完全相同的字符; 它们只是Unicode的两种传输编码.Windows为UTF-16使用名称"Unicode",因为它在内部使用UTF-16作为Unicode. (3认同)
  • @Qaesar每个UTF都可以编码所有Unicode. (3认同)
  • @Qaesar,任何合理的文本处理软件都可以读取UTF-16(Windows"Unicode")和UTF-8,并在需要时转换为其内部表示.如果您编写自己的程序代码,则只需从库中选择合适的输入读取例程.所以它并不重要.Windows软件内部使用UTF-16.但是对于网页,应该使用UTF-8(浏览器和搜索引擎很难支持UTF-16). (2认同)