我有一些由不同字符编码编码的文本文件,例如ascii, utf-8, big5, gb2312.
现在想知道他们的准确字符编码,用文本编辑器查看,否则会出现乱码。
我在网上搜索,发现file命令可以显示文件的字符编码,例如:
$ file -bi *
text/plain; charset=iso-8859-1
text/plain; charset=us-ascii
text/plain; charset=iso-8859-1
text/plain; charset=utf-8
Run Code Online (Sandbox Code Playgroud)
不幸的是,用big5和编码的文件gb2312都存在charset=iso-8859-1,所以我仍然无法区分。有没有更好的方法来检查文本文件的字符编码?