如何将文件从ASCII转换为UTF-8？

Question

如何将文件从ASCII转换为UTF-8？

Ram*_*Ram 2 unix linux encoding ascii utf-8

我正在尝试将一堆文件从ASCII转码为UTF-8.

为此,我尝试使用iconv:

iconv -f US-ASCII -t UTF-8 infile > outfile

Run Code Online (Sandbox Code Playgroud)

-f ENCODING 输入的编码

-t ENCODING 输出的编码

该文件仍未转换为UTF-8.它是一个.dat文件.

在发布之前,我搜索了Google并找到了以下信息:

ASCII是UTF-8的子集,因此所有ASCII文件都已经过UTF-8编码.ASCII文件中的字节和"将其编码为UTF-8"所产生的字节将完全相同.它们之间没有区别.

强制编码从US-ASCII到UTF-8(iconv)

在字符集之间转换文本文件的最佳方法？

上述链接仍无济于事.

即使它是ASCII格式,它也支持UTF-8,因为UTF-8是一个超级集合,另一方要接收我的文件需要文件编码为UTF-8.他只需要文件格式为UTF-8.

请给我任何建议.

Answer 1

Tim*_*hns 12

我对这个问题感到有点困惑,因为正如你所说,ASCII是UTF-8的一个子集,因此所有的ASCII文件都已经过UTF-8编码了.

如果您只向另一方发送仅包含ASCII字符的文件,但另一方抱怨他们不是'UTF-8编码',那么我猜他们指的是ASCII文件有没有明确指示内容为UTF-8的字节顺序标记.

如果确实如此,那么您可以使用以下答案添加字节顺序标记:

iconv:使用BOM从Windows ANSI转换为UTF-8

如果对方表示他不需要"BOM"(字节顺序标记),但仍然抱怨文件不是UTF-8,那么另一种可能性是你的初始文件实际上不是ASCII,而是包含字符使用ANSI或ISO-8859-1编码的.

编辑后添加以下实验,在Ram对使用'file'命令寻找类型的另一方发表评论之后

Tims-MacBook-Pro:~ tjohns$ echo 'Stuff' > deleteme
Tims-MacBook-Pro:~ tjohns$ cat deleteme
Stuff
Tims-MacBook-Pro:~ tjohns$ file -I deleteme
deleteme: text/plain; charset=us-ascii
Tims-MacBook-Pro:~ tjohns$ echo -ne '\xEF\xBB\xBF' > deleteme
Tims-MacBook-Pro:~ tjohns$ echo 'Stuff' >> deleteme
Tims-MacBook-Pro:~ tjohns$ cat deleteme
Stuff
Tims-MacBook-Pro:~ tjohns$ file -I deleteme
deleteme: text/plain; charset=utf-8

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，10 月前
查看次数：	23986 次
最近记录：	6 年，12 月前