use*_*232 3 language-agnostic character-encoding
如何区分UTF-8(无BOM)和ASCII文件?
Ste*_*sop 5
如果文件包含设置了最高位的任何字节,则它不是ASCII.
因此,如果唯一的可能性是ASCII或UTF-8,那么它是UTF-8.
如果文件只包含顶部位清除的字节,那么区分它是ASCII还是UTF-8是没有意义的,因为它代表完全相同的字符系列.但你可以称之为ASCII.
当然,这并不区分UTF-8与ISO Latin或CP1252,也没有确认所谓的UTF-8实际上是有效的.
归档时间:
14 年,10 月 前
查看次数:
863 次
最近记录: