All*_*ang 7 go
我正在尝试使用Go在Windows上找出文件的编码.做了一些研究,我发现了许多关于Mozilla的Charset Detectors(chardet)的建议,但它们很难编译,我没有运气.
我也发现了libguess,它似乎在Linux中被广泛使用,但我无法在Windows中使用它.
最好的方法是什么?是否有与Go在Windows上使用的事实上的标准库?
zou*_*oul 0
您可能对Enca感兴趣,极其简单的字符集分析器。我想您可以尝试使用所有候选编码读取文件,并计算每次尝试与该语言的 \xe2\x80\x9cstandard\xe2\x80\x9d 字符频率分布的距离。Enca 需要一些语言信息,但 I\xe2\x80\x99m 不确定它是否使用这种方法。(它\xe2\x80\x99只是一个想法,它可能会被严重误导。)
归档时间:
14 年 前
查看次数:
1967 次
最近记录:
13 年,5 月 前