小编You*_*ung的帖子

如何在 Linux 中检查文件的字符编码

我有一些由不同字符编码编码的文本文件,例如ascii, utf-8, big5, gb2312.

现在想知道他们的准确字符编码,用文本编辑器查看,否则会出现乱码。

我在网上搜索,发现file命令可以显示文件的字符编码,例如:

$ file -bi *
text/plain; charset=iso-8859-1
text/plain; charset=us-ascii
text/plain; charset=iso-8859-1
text/plain; charset=utf-8
Run Code Online (Sandbox Code Playgroud)

不幸的是,用big5和编码的文件gb2312都存在charset=iso-8859-1,所以我仍然无法区分。有没有更好的方法来检查文本文件的字符编码?

linux encoding utf-8 character-encoding

6
推荐指数
1
解决办法
2万
查看次数

标签 统计

character-encoding ×1

encoding ×1

linux ×1

utf-8 ×1