是否有可能"嗅"字符编码?

sha*_*bda 5 python csv unicode character-encoding

我有一个接受CSV文件的网页.可以在各种地方创建这些文件.(我认为)无法在CSV文件中指定编码 - 因此我无法将所有这些编码都视为utf-8或任何其他编码.

有没有办法聪明地猜测我得到的CSV编码?我正在使用Python,但也愿意使用语言无关的方法.

asc*_*moo 6

通过仅查看文件本身没有正确的方法来确定文件的编码,但您可以使用一些基于启发式的解决方案,例如:chardet