如何确定文本编码

par*_*uma 5 java utf

我知道UTF文件有用于确定编码的BOM但是其他编码却不知道如何猜测编码.

我是新的java程序员.我编写了使用UTF BOM猜测UTF编码的代码.但我有其他编码的问题.我怎么猜他们.

有人可以帮帮我吗?提前致谢.

Álv*_*lez 0

简短的回答是:你不能。

即使在 UTF-8 中,BOM 也是完全可选的,并且通常建议不要使用它,因为许多应用程序无法正确处理它,只是将其显示为可打印字符。字节顺序标记的最初目的是告诉 UTF-16 文件的字节顺序。

也就是说,大多数处理 Unicode 的应用程序都会实现某种猜测算法。阅读文件的开头并查找某些签名。