Ste*_*sop 5

如果文件包含设置了最高位的任何字节,则它不是ASCII.

因此,如果唯一的可能性是ASCII或UTF-8,那么它是UTF-8.

如果文件只包含顶部位清除的字节,那么区分它是ASCII还是UTF-8是没有意义的,因为它代表完全相同的字符系列.但你可以称之为ASCII.

当然,这并不区分UTF-8与ISO Latin或CP1252,也没有确认所谓的UTF-8实际上是有效的.