解压缩 unicode 文件时如何避免损坏的语言？

Question

解压缩 unicode 文件时如何避免损坏的语言？

我经常在解压缩 zip 文件时看到未知的文件名。

例如，

 ???¤????-Bb??????????-????????,?????????? ?????????????? ,??????

Run Code Online (Sandbox Code Playgroud)

问题的解决方案是什么？

Answer 1

use*_*.dz 7

韩文 MS Windows 编码 cp-949可用于压缩原始文件。尝试unzip使用 Windows 编码选项。

unzip -O cp-949 <file.zip>

Run Code Online (Sandbox Code Playgroud)

注意：我查看了原始海报的简介以了解他/她在哪里（韩国首尔）。对于其他用户，您必须检查zip的来源并分别更改编码。

Answer 2

wis*_*cky 7

尝试使用 p7zip。（@Pilot6 提到 p7zip 不适用于非 UTF-8 编码，但如果您只需要 UTF-8，那么这是一个简单的解决方案。）

apt-get update
apt-get install p7zip-full
7z x thefile.zip -o"outputDir"

Run Code Online (Sandbox Code Playgroud)

Answer 3

Pil*_*ot6 1

如果您使用标准 Ubuntu Archive Manager 和 Ubuntu 版本 14.04+，则可以通过安装修补的 Archive Manager (file-roller) 来解决此问题。问题是，如果安装了 p7zip-full，file-roller 使用 p7zip 来解压缩 zip 存档。但 p7zip 不能很好地处理非 UTF-8 编码。我修补了 file-roller 以便始终使用 unzip 来实现此目的。解压缩本身已修复。修补后的 file-roller 可以从我的 ppa 安装

sudo add-apt-repository ppa:hanipouspilot/file-roller
sudo apt-get update
sudo apt-get install file-roller

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，6 月前
查看次数：	11367 次
最近记录：	4 年，5 月前