我想将文件夹中的数千张图像存档到外部驱动器上。在谷歌搜索压缩时,我遇到了将压缩级别设置为“存储”的能力,这意味着数据没有被压缩。
这样做是否有优势,而不仅仅是将文件以未压缩形式保留在 Windows 文件夹中?它对 HDD 的性能有帮助吗?
这样做是否有优势,而不仅仅是将文件以未压缩形式保留在 Windows 文件夹中?
是的。
正如Keltari 的回答所指出的那样,人们可能会发现处理一个文件比处理多个文件更容易。在实践中,实际上,如果一个人有一堆文件,他们通常可以将文件放在一个文件夹中,然后对该文件夹进行文件操作(例如,复制)。包含文件的归档文件的一般概念和包含文件的目录/文件夹的概念非常相似。事实上,这些概念是如此相似,以至于微软对 ZIP 文件的支持,内置在 WinXP(和更新版本)和一些添加了某些代码的 Win9x 系统的图形界面中,在微软的图形界面中被命名为“Microsoft 压缩文件夹”。
示例:当我使用基于 Web 的邮件软件 SquirrelMail 时,我可以上传文件。我可以一次上传多个文件。我不能只选择一堆文件并上传批次。如果我有 30 个文件要上传,我可以告诉 7-Zip 使用“存储”压缩文件,这样我就不会浪费大量时间来尝试压缩数据(如果我知道数据是不可压缩的),然后我可以轻松地在 SquirrelMail 中上传一个(压缩的)文件。
有时,可能会禁止某些文件扩展名(例如 .exe),而可能允许存档(通过防火墙、电子邮件客户端使用的反恶意软件保护等)
但是,除了某些软件表面上的“易用性”之外,可能还有其他优点。如果文件存档格式包含压缩数据的文件完整性哈希,则可以在访问数据时检查文件完整性。如果未使用文件存档格式,这可能会导致检测到可能无法检测到的错误。
当然,理论上,文件系统可以包含存储文件哈希的元数据。这里的区别在于文件系统通常不包含这种类型的数据,而存档则包含。因此,即使文件系统可以拥有这些数据,它们通常也没有(至少,传统上没有许多较旧的文件系统类型)。
“存储”方法通常由存档软件实现的另一个原因是它非常易于编程。因此,使其成为可用选项几乎没有缺点。
如果数据被备份,那么存档通常会包含一个时间戳,这可以是一种简单的方法来记录所包含文件的时间。目录/文件夹可能没有相同类型的时间戳。或者,他们可能。对于不同的文件系统类型(例如,NTFS 与 exFAT、Ext3、Btrfs 与 ISO9660)和实现这些文件系统的不同操作系统,有时文件系统类型具有多个日期(创建/修改/访问),人们可能不愿意信任目录的日期实际上反映了内容更新的时间(而不是其他一些含义,例如目录的创建、重命名或权限更改时间,但不一定是数据修改时间)。存档文件的时间戳,特别是如果该时间是文件名的一部分,通常是值得信赖的。
它对 HDD 的性能有帮助吗?
希望不是。毕竟,这样存储的文件通常有开销(来自一些称为“标题”的数据),因此存档数据通常会稍微慢一些,而不是更快。但是,可能存在例外情况:它可能会更快。
有时,一些代码会定位一个文件,这需要很长时间(可能是因为它基本上是对大量文件进行排序)。执行文件操作(复制/删除/任何)后,定位下一个文件将需要很长时间。通常可以通过使用软件(包括文件系统驱动程序)来避免此类问题,这些软件已针对此类情况进行了优化。然而,在其他情况下,已知会发生这种情况。复制一个大文件通常不会有完全相同的成本。(再说一次,至少在历史上,有时处理大文件可能会产生很大的成本,这可能是更大的成本。)
使用存储而不是压缩的最大优点是存储速度更快。这是因为需要花费时间来执行进行数据压缩所需的计算。
很多这种看法是基于较旧的技术。实际上,如果 CPU 足够快(这样压缩数据不会花费太多时间)并且如果数据被压缩到足够少的数据需要从磁盘写入/读取,那么压缩可以节省时间。较大数据的快速 CPU 压缩,加上压缩数据的慢速写入,可能比未压缩数据的慢速写入快。
也可能有其他因素,例如更脆弱的设备(如硬盘驱动器)的使用较少(“磨损”)。
压缩(和存储压缩数据)还是存储(未压缩数据)更快取决于:压缩的速度、压缩的有效性(执行压缩后数据变小了多少)以及写入的速度/读取大量数据。结果往往会随着时间的推移而变化,这取决于 CPU 速度、算法有效性(不同的算法,以及用于这些算法的可能不同的选项)和存储速度的差异。
一般来说,解压通常比压缩快得多(因为它只是根据已知结果重新创建数据,并且不涉及太多探索/猜测),因此如果您必须一次写入数据然后多次读取它,压缩通常是值得的。对于其他情况,许多人没有发现使用压缩的好处。
由于CPU功率足够低于历史倍的速度,存储似乎是越来越少用。(人们通常至少可以容忍最小/快速压缩形式的成本。)但是,存档程序(如 7-Zip)通常希望继续支持“存储”,以便人们仍然可以访问(提取/修改)使用存储技术,并且因为它可能对某些人(在旧系统上)有帮助,并且因为它可以用于其他任务(快速创建数据组合,而不用浪费时间尝试压缩不太可能很好压缩的数据) ,并且由于存储是一个简单的过程,因此几乎没有动力将其删除,因此该选项往往保持可用。
归档时间: |
|
查看次数: |
20447 次 |
最近记录: |