Tim*_*Tim 20 character-encoding textfiles
sle*_*ske 19
我想知道某些文本文件是否将其编码方法与文本内容一起存储以供以后解码?
Mark Szymanski 的回答是正确的——纯文本文件中没有明确的编码信息——这就是“纯文本文件”的定义,“纯文本”是指文件中没有元数据的事实。
但是,某些应用程序会在编码为 UTF-16 或 UTF-32/UCS-4 的文本文件中放置字节顺序标记(BOM)。BOM 并不是真正用来表示编码(它表示字节顺序,顾名思义),但许多应用程序将使用 BOM 的存在来识别 UTF-16/UTF-32,因此它用作编码指示符。
或者是文本查看器的工作是猜测给定文本文件的编码方法,而猜测可能并不总是正确的?如果是,文本查看器如何猜测?
是的,文本查看器只能猜测。它通常使用一些启发式方法:
vim默认的工作方式:它在读取文件时首先尝试使用 UTF-8;如果失败,则回退到 ISO-8859-1。在大多数情况下,必须明确告知程序文本文件的编码是什么,否则将无法正确读取。
| 归档时间: |
|
| 查看次数: |
3371 次 |
| 最近记录: |