如何查找具有给定字符编码的文件?

Daw*_*hia 10 search encoding software-rec

我使用的是 Windows XP。我正在寻找一种工具,可以为给定目录找到具有特定字符编码(如 UTF-8)的所有文件。你知道这样的工具吗?

mik*_*son 7

这个工具很好用。一探究竟。它显示文件夹的所有文件及其编码。

http://encodingchecker.codeplex.com/releases/view/59420

还有这个,用于将文件批量更改为 UTF8。

http://www.rotatingscrew.com/utfcast.aspx


Red*_*ick 5

一般来说,这是不可能的 - 除了带有字节顺序标记的 UTF-8 文本文件的特殊情况。由于编码的名称未存储在文本文件中,因此区分 CP437 和 CP850 的唯一方法是根据整个文件的统计分析、查看某些字符对的频率等进行猜测。

Solaris 用户有auto_ef,但据我所知,没有 Windows 端口。

Perl 用户有Encode::Guess

根据维基百科“较新版本的 unix File 命令尝试对字符编码进行基本检测。(也可在 cygwin 和 mac 上使用)”

以上都不是 100% 可靠的。如果您的文件肯定全部采用少数已知编码之一,您可能会做得更好。


har*_*ymc 1

在 Windows 下,这可以通过搜索正确的字节顺序标记 (BOM)来实现,前提是文件是使用 BOM 创建的。

您需要一个搜索程序来实现这一点。
一种可能是适用于 Windows 的 Grep并使用文件开头运算符 (^^) 进行搜索。