包含“^@”字符的 XML 文本文件?

use*_*394 3 character-encoding text-processing conversion

我有一个需要解析的 XML 文件。当我在 nano 中打开它时, nano 给我消息(converted from Mac format)。然而,在每个字符之间,有一个^@序列,如下所示:

^@t^@h^@e^@ ^@q^@u^@i^@c^@k^@ ...
Run Code Online (Sandbox Code Playgroud)

这是什么格式,如何才能正确显示?我如何转换它?

Con*_*lls 7

它是一种双字节格式,可能是UTF-16。 看看您是否可以在文件开头识别BOM(字节顺序标记)标题。这将告诉您编码是否存在,尽管它可能不存在。请注意,文本编辑器可能会将其隐藏起来,因此您可能需要使用十六进制转储实用程序(例如od或类似的工具)查看文件以查看 BOM。

存在一些可能有帮助的字符集转换实用程序。几个例子是iconvrecode。您可以使用其中一种将文件重新编码为一种可以很好地与您的文本编辑器配合使用的格式。

如果您需要以编程方式进行翻译,大多数语言(例如 Python)都有用于在编码方案之间进行映射的库。 www.unicodetools.com显示了各种语言的一些相关咒语。可以在这里找到一个很好的 Unicode 常见问题解答,Unicode Consortium 的网站上有很多关于这个主题的有用资源。