我有一个.rar包含单个.tar.gz文件的多部分存档(不要问为什么,这就是它的制作方式)。我错过了一些部分,但确实有第一部分。我想尽可能多地提取.tar.gz。我怎样才能做到这一点?
如果我运行unrar x -kb file.part1.rar它总是提取.tar.gzfrom的开头part1并在那里停止并出现错误。我很乐意尝试任何工具(不必解压缩)。
我在 EXT 分区上有一堆用 ddrescue 制作的磁盘映像,我想在不丢失数据的情况下减小它们的大小,同时仍然可以安装。
如何用零填充图像文件系统中的空白空间,然后将文件转换为稀疏文件,这样这个空白空间实际上并不存储在磁盘上?
例如:
> du -s --si --apparent-size Jimage.image
120G Jimage.image
> du -s --si Jimage.image
121G Jimage.image
Run Code Online (Sandbox Code Playgroud)
不过,这实际上只有 50G 的真实数据,所以第二次测量应该小得多。
这应该会用零填充空白空间:
cat /dev/zero > zero.file
rm zero.file
Run Code Online (Sandbox Code Playgroud)
但是如果稀疏文件被透明处理,它实际上可能会创建一个稀疏文件而不向虚拟磁盘写入任何内容,具有讽刺意味的是阻止我将虚拟磁盘映像本身转换为稀疏文件。:) 可以?
注意:出于某种原因,sudo dd if=/dev/zero of=./zero.file当cat不在已安装的磁盘映像上时有效。
我桌面上的所有文件以及我从 Internet 下载的每个文件都突然在 Windows 10 中被压缩(如图标右上角的两个蓝色箭头所示)。我从来没有在 Windows 中设置过这样的设置。这是病毒还是别的什么?
我的硬盘是 128GB SSD 和 5GB 可用空间。
那么为什么会发生这种情况呢?是否可以选择关闭此行为?
比标题更准确,假设我有一个 320 kbps 的 MP3 文件。如果我解压缩它,那么从逻辑上讲,除了每秒音频中大约 320 KB 之外的所有数据都应该是冗余数据,可以被压缩掉。那么,当我将解压缩文件编码为 FLAC 或任何其他无损编解码器时,为什么它会大得多?
在相关说明中,理论上是否可以从解压缩的 wav 无损恢复源 mp3 音频?(我知道 mp3 本身是有损的。我在问是否可以重新编码而不会造成任何进一步的损失。)
编辑:让我澄清相关问题及其背后的基本原理。假设我有一个从 MP3 文件解压缩的 wav(并且假设我由于某种原因没有 mp3 本身)。如果我不想再损失任何质量,我可以使用 FLAC 或任何其他无损编码器对其重新编码,并获得更大的文件以保持相同的质量。或者,我可以再次将其重新编码为 mp3 并获得与原始大小相同的大小,但会丢失更多数据。显然,这两种情况都不是理想的。我可以拥有原始大小或原始质量,但不能同时拥有(我指的是原始 mp3 的质量,而不是原始无损源的质量)。我的问题是:我们可以同时获得吗?理论上是否可以从有损解压数据中恢复有损压缩数据,而不会丢失更多?
如果可能的话,我可以想象一个无损压缩算法,用 FLAC 压缩音频。然后它还会扫描音频以查找先前有损压缩的任何迹象,如果检测到,则将其无损地重新压缩为原始有损文件。然后它保留较小的文件。
我正在寻找可以对正在归档的文件执行重复数据删除 (dedupe) 的归档程序。解压缩存档后,该软件会将在压缩过程中删除的所有文件放回原处。
到目前为止,我发现:
任何人都知道其他人吗?
这可能是 7-zip 的一个很棒的补充。
运行 Linux。我有一个包含大约 150 个大型 CSV 文件的目录;简单地zip -9对它们执行 a 会导致一个仍然太大的整体文件。我希望它可以简单地将它们压缩成四个或五个 zip 文件,每个 30-40 个 CSV;这样排序或跨越 zip 顺序不会成为问题,因为每个 zip 都是独立的。必须有一个简单的方法来做到这一点。有什么建议?
(是的,如果可能,zip 是首选格式)
在 Windows 上,我可以使用 NTFS 驱动器压缩来节省大量磁盘空间;通常为 30%,通常更多。它还以更高的 CPU 使用率为代价提高了读写速度;在我的情况下,这不是一个争论点,因为 CPU 功率不够。
所以在我的 Windows 机器上它总是启用的。Ext4 上是否有类似的功能,或者(Ubuntu)Linux 上是否有支持压缩的不同文件系统?如果是这样,我如何将我的 Ext4 文件系统迁移到该压缩文件系统?
我试图以良好的比率压缩 100GB,所以我决定使用 xz。我不需要它非常快,但由于我有一个 8 线程 CPU,我想知道如何利用它们。
我发现 xz 有一个并行实现:pixz。我也发现 xz 有一个多线程选项 -T。我正在试验他们两个,但我看不出他们的行为有什么不同。
它们之间有什么区别?为什么 xz 有 2 个并行实现?
编辑:我发现还有一个:pxz。
我正在尝试使用zipMac OS X 终端附带的命令行工具创建一个 ZIP 文件。我想递归压缩当前文件夹的内容但不包括.DS_Store文件。我正在尝试这样做:
zip -r myarchive.zip . -x .DS_Store
Run Code Online (Sandbox Code Playgroud)
在-x .DS_Store该排除.DS_Store在当前文件夹中的文件,而不是在递归添加子文件夹。如何.DS_Store从所有子文件夹中排除所有文件?
自上次 Windows 10 更新以来,我几乎在每个项目上都有这些蓝色双箭头(所有文件和文件夹都是 NTFS 压缩的)。
我怎样才能删除这些?

compression ×10
linux ×3
filesystems ×2
windows-10 ×2
zip ×2
audio ×1
bsd ×1
command-line ×1
flac ×1
icons ×1
macos ×1
mount ×1
mp3 ×1
rar ×1
software-rec ×1
tar ×1
ubuntu ×1
winrar ×1
xz ×1