ten*_*use 5 linux encoding ntfs ext3 utf-8
我用谷歌搜索了这个主题,但找不到我要找的东西......以下“发生”在我身上:
\n\n我将文件存储在 NTFS-USB 硬盘上,由于空间问题,我将它们移至 ext3 系统......不知何故,文件名(据我所知内容仍然没问题)编码搞砸了......我的文件现在看起来像下面这样:
\n\nKk\xc3\x83\xc2\xbcken <--- should have an "\xc3\xbc"\nJ\xc3\x83\xc2\xa4ger <--- should be an "\xc3\xa4"\nZw\xc3\x83\xc2\xb6lf <--- should be an "\xc3\xb6"\nf\xc3\x83\xc2\xbcnfte <-- should be an "\xc3\xbc"\netc ....\n
Run Code Online (Sandbox Code Playgroud)\n\n这些只是例子,但已经给了我我的第一个问题\n为什么“\xc3\xbc”有两种不同的表示形式?\n(也许我搞砸了,在我搞砸之前,现在我混合了x个不同的编码层?:))
\n\n我尝试了以下命令:
\n\nconvmv -r -f UTF-8 -t ISO-8859-1 *\n
Run Code Online (Sandbox Code Playgroud)\n\n此命令适用于某些文件(例如Zw\xc3\x83\xc2\xb6lf
),但不适用于所有文件:
iso-8859-1 doesn\'t cover all needed characters for: "f\xc3\x83\xc2\xbcnfte"\n
Run Code Online (Sandbox Code Playgroud)\n\n所以我猜它一定是另一种编码——但是是哪种?我怎样才能找到这个?
\n\n还有什么方法可以解决这一切吗?
\n我将这 4 行复制并粘贴到一个文本文件中,然后在 Firefox 中打开它。浏览器自动检测它是UTF-8并显示以下内容
\n\nKk\xc3\xbcken <--- should have an "\xef\xbf\xbd"\nJ\xc3\xa4ger <--- should be an "\xef\xbf\xbd"\nZw\xc3\xb6lf <--- should be an "\xef\xbf\xbd"\nf\xc3\xbcnfte <-- should be an "\xef\xbf\xbd"\n
Run Code Online (Sandbox Code Playgroud)\n\n您的原始副本没有“搞砸”,它正确地获取了 NTFS unicode 文件名。相反,您的 display/tty/font 似乎不支持 UTF8/unicode 输出。
\n\n也许尝试在 X windows 环境中查看您的副本。
\n