我有一些文件,其中包含字符串,需要将它们转换为UTF8 with perl是否有任何选项使用perl来运行这些文件并将每个字符串转换为utf8并且如果某些字符串是utf8编码以保持它们的原样?
你说文件的某些部分是使用UTF-8编码的,有些是使用别的东西编码的,但你没有指定其他编码,这很重要.
一般来说,通过查看字符串来判断字符串的编码是不可能的.但是,如果你正在处理US-ASCII,iso-8859-1,cp1252和UTF-8的混合,你可以实际告诉*,并且有人已经为你编写了这个工具.
Encoding :: FixLatin附带一个名为的脚本fix_latin,它将上述编码混合的文件转换为UTF-8.