ein*_*lum 16 backup hard-drive maintenance
我在外部 HDD 上备份了一堆目录 - 而不是 SSD,而是磁盘。
备份只是在一个磁盘上(是的,我知道,一个带有副本的额外 HDD 是个好主意;但现在情况并非如此)。此外,磁盘上没有文件的双重副本。
HDD 的空间(选项 1)比我的文件占用的空间多得多(选项 2)比我的文件占用的可用空间少(但仍然是一个不错的数量)
我将磁盘保存在其原始包装中:塑料袋,在“鸡蛋盒”(如包装)内,在塑料盒内。它保存在我家的一个房间里,盒子从不暴露在阳光下,也不会下雨等。
我的问题是:我应该定期对磁盘做些什么来最大限度地延长数据寿命?例如将所有内容读取到其他地方,或读写回,或以某种方式重新调整磁盘上数据的物理位置,甚至摇晃磁盘,改变其物理位置,不做任何事情就打开它,等等。我想要我描述的两个可选场景的答案。
笔记:
由于这里的大多数海报似乎都遗漏了它,这是我对您问题的具体细节的推荐答案,使用这篇出色的帖子,应使用哪种介质进行长期、高容量、数据存储(存档)?作为向导。我不会重新引用那里的参考资料和研究,因为他做得很好,阅读整篇文章比这个案例的摘要要好。
将自己限制在冷存储(离线)中的一个 HDD,给定两个选项,您应该每隔几年或大约连接一次驱动器,然后启动它。这样做的最大原因是为了防止主轴润滑脂硬化和卡住。随着时间的推移,主轴油脂会变硬,偶尔旋转磁盘会显着延迟这种可能性。如果您想深入了解润滑脂对 HDD 的重要性,请查看美蓓亚 (Minbea) 的工作量,一家 HDD 电机制造商在本报告中对其进行了研究。
连接磁盘后,您还可以运行一些 SMART 诊断程序来查找电子设备、硬件或盘片即将发生故障的迹象。虽然,根据谷歌和卡内基梅隆大学在 FAST'07 上展示的研究{获得当年的“最佳论文”},SMART 测试可能表明失败,但“通过”测试可能并不表明身体健康。尽管如此,检查不会有什么坏处。是的,这是一项古老的研究,但似乎没有人用更新的东西取代它。
让驱动器运行一段时间并访问数据也会更新保存数据的磁场强度。有些人根据大量轶事证据认为没有必要,但目前的研究似乎表明磁场减弱是可能的。我展示了威斯康星大学麦迪逊分校的三篇论文:奇偶校验污染、数据损坏和磁盘指针损坏。阅读完这些内容后,您可以决定他们的结论对您的数据有多大的威胁,以及值得付出多少努力来防范它。
我不知道你使用什么操作系统,你拥有或喜欢什么工具,也不知道你选择什么文件系统。因此,我的建议只是通用的,允许您选择最适合您的配置和偏好的工具。
首先是存储设置。在将文件保存到 HDD 之前,创建它们的存档。这并不意味着压缩,也没有避免压缩。选择一种能够为您提供错误恢复或“自我修复”能力的存档格式。不要创建一个庞大的存档,而是存档属于一起的东西,创建一个存档库。如果您选择压缩,请确保它不会干扰错误恢复能力。对于大多数音乐、视频、电影和图片格式,进行压缩是没有意义的。此类文件格式已被压缩,尝试压缩它们很少会获得空间,有时会产生更大的空间文件,并在讨价还价中浪费您的时间和 CPU 能力。尽管如此,将它们存档以进行上述错误恢复。然后使用您选择的摘要算法为每个存档文件创建一个校验和。安全不是这里的问题,只是文件的健全性检查,所以 MD5 应该就足够了,但任何事情都可以。使用存档文件保存校验和的副本,并且在同一个 HDD 上的第二个位置 - 可能是用于总校验和的专用目录。所有这些都保存到磁盘中。接下来,非常重要的是,还要在该 HDD 上保存用于创建校验和和恢复存档的工具(如果使用压缩,还可以解压缩它们)。根据您的系统,这可能是程序本身,也可能需要是它们的安装程序。现在您可以按照您选择的方式存储硬盘。
其次是存储。当前的 HDD 可以合理地保护免受物理冲击(震动和弹跳冲击),但也没有必要推动它。几乎按照您在问题中提到的方式存储它。我会尝试避免可能受到电磁力影响的区域。例如,与断路器面板或 HAM 收音机上方不同。数英里之外的闪电是你无法避免的,但吸尘器和电源说是可以避免的。如果您想变得极端,请为它买一个法拉第盾牌或法拉第袋。在你的建议中,有两个要么毫无意义,要么不好。在储存时改变它的物理位置不会影响任何重要的事情,而摇晃它可能会造成损坏,不应该因为大多数驱动器具有良好的 G-shock 保护,但它是可能的。
最后是定期措施。例如,按照您选择的计划,每年或每两年,将其从存储中删除并重新连接到计算机。运行 SMART 测试,并实际读取结果。当 SMART 结果显示您应该更换磁盘时,请准备好更换磁盘,而不是“下次”,而是“这次”。当它连接时,根据它们的校验和检查所有存档文件。如果有任何检查失败,请尝试使用存档格式的错误恢复功能来恢复该文件、重新创建存档及其校验和并重新保存。由于您还给选项 2 提供了“大量”可用空间,因此将档案复制到新目录,然后删除原始文件。简单地“移动”它们可能根本不会移动它们。在许多较新的文件系统上,移动文件会改变它在哪个目录中列出,但文件内容将保持原样。通过复制文件,您将其强制写入其他地方,然后您可以通过删除原始文件来释放空间。如果您有许多存档文件,则没有一个文件可能大到填满 HDD 上的可用空间。在您验证或恢复所有文件并移动您选择的任何文件后,恢复您的包装并将其放回存储中,直到下次。
需要注意的额外事项。当您升级系统,或者更糟的是,切换到不同的操作系统时,请确保您仍然能够读取新配置中的硬盘。如果您有任何非纯文本内容,请确保您不会失去读取已保存文件的能力。例如:MS-Word 文档可以以一种格式创建公式,较新的版本无法读取这些公式。看到这个问题。然而,Word 并不是唯一可能的问题来源,甚至开源格式也不能保证您的数据是面向未来的。对于这个领域的重大错误,请阅读失败的数字世界末日图书项目. 随着新技术的出现,请考虑更新您的收藏。如果您将电影保存为 AVI 文件,并且您更喜欢 MKV,请转换它们。如果您有文字处理文档并升级了程序,请以新格式重新保存存档的文档。
从专业的角度来看,您的选择是:
在您的“选项 1”(更多空间)中,您可以通过在同一硬件上制作多个副本来略微增加您的几率,但事实是硬件出现故障,并经常导致整个磁盘不可读。单个副本不是可行的备份策略。
我不清楚这是实际备份(主设备上的文件)还是存档(从主设备中删除的文件。)如果您完全关心存档情况,则额外的副本更为重要 - 在备份案例理论上有一个主副本,所以在你完全不走运之前你必须至少有两次失败。
如果您的可用空间多于备份数据使用的空间- 您在问题中的选项 1 - 或者如果您有多个数据副本,我有一个想法可以“做点什么”;如果您认为 SpinRite 确实有助于硬盘“维护”和/或想要完全覆盖然后重新写入您的每一位数据,那么就可以做到。
无论您是否应该做某事,我都不太确定......位腐烂或数据降级似乎确实存在,超级用户上的这个问题和serverfault上的这个问题似乎建议备份或可能是错误-纠正或容错 RAID(但仅对于单个硬盘,我会选择多个备份和哈希/CRC 检查,而不用担心 RAID 失败时该怎么办)。
我倾向于更简单和懒惰的“无所作为”的方法,但以下至少是一个很好的“确保我仍然可以每年读取一次我的数据,并且也可以重写它”的想法。
很多人似乎相信 SpinRite 确实有效,但它不是免费的,而且我运行的是 Linux,所以我听过 Steve Gibson 的SpinRite 如何工作?视频,他说 SpinRite 现在做的事情之一是:
如果驱动器发现任何(次要)问题,这应该“促使驱动器本身将坏扇区与好的扇区交换”。
你应该多久做一次?史蒂夫说“没有人真正知道那是多久一次,但每隔几个月就足够了”。我只是猜测每 6 个月或每年左右。
badblocks读取/翻转/读取/翻转过程听起来几乎与badblocks使用它的写入模式测试(-w选项)相同,只是它并没有真正“位翻转”您的数据,而是破坏性地写入,读取和翻转所有分区上的位:
使用此选项,badblocks 通过在设备的每个块上写入一些模式(0xaa、0x55、0xff、0x00)、读取每个块并比较内容来扫描坏块。
并非巧合的是,这些模式是二进制的:10101010、01010101、11111111、00000000。
所以 badblocks 非常彻底地写入、读取和翻转位,而且它也是免费的。如果您mke2fs运行了 badblocks (with badblocks -cc),它将保存 badblocks 的列表,因此 ext2/3/4 将避免它们,如果找到的话。
缺点是 badblocks 的写测试具有 破坏性,因此您至少需要两个分区才能使其工作(以保存和写回您的数据)。
badblocks -w或mke2fs -cc(只有一个分区,不要覆盖所有的数据,只有一个副本!)这类似于重新格式化和复制您的数据,但是快速/标准格式通常不会写入每个扇区,因此您最终可能不会更改/翻转许多位
最好的解决方案始终是在多个设备上创建多个副本。
我读过光学介质可以读取 10、20 年,甚至 50 多年,并且两个相同的磁盘/ISO 将适合gddrescue(如下)。
云存储通常只有几 GB 是免费的,在那里存储文件(可选加密)可能是个好主意,尤其是在数量不断增加的情况下。
此外,如果确实出现任何错误,将文件保存在纠错存档中可能会有所帮助,但丢失百万分之一的文件可能不像丢失一百万个文件的整个存档那么糟糕。如果存在任何单独的纠错软件,例如 ECC-CRC,那可能会有所帮助,但我不知道有任何软件,并且数据的额外副本会更好。
与切线相关的是,SpinRite 还“非常努力地”从硬盘驱动器的坏扇区读取数据,从不同方向和速度读取,这听起来也非常相似gddrescue,以防(或何时)您在读取数据时遇到问题. gddrescue 还可以从有错误的两个数据副本中读取,并希望将一个完整的良好副本拼凑在一起,我很想用 制作两个(或更多)相同的数据分区副本dd,但是如果 badblocks 确实找到了任何坏扇区无法避免它们,因为它会更改相同的副本。
| 归档时间: |
|
| 查看次数: |
3130 次 |
| 最近记录: |