备份检查的最佳实践?

Kaz*_*lis 21 backup monitoring backup-restoration best-practices

这是一种常见的情况,当管理员制作系统自动备份并忘记它时。只有在系统出现故障后管理员才注意到,该备份系统之前已损坏或备份因某些故障而无法恢复并且他没有当前备份可从中恢复......那么什么是避免这种情况的最佳实践?

小智 28

运行防火练习......每隔几个月就说 XYZ 系统宕机是个好主意......然后实际上通过将它重新联机到一个新的 VM 等的动作。它保持诚实并帮助你抓住错误。


Mr *_*ark 10

肥皂盒模式:开启

我想说的是,没有定期测试的备份是毫无价值的,这很简单。

在我之前的工作中,我们有一项政策,即每个系统(生产、测试​​、开发监控等)都应该每 6 个月进行一次测试恢复。

这也是最初级管理员的工作,因此文档是最新的。Junior 被定义为他/她在特定系统上做了多少工作,有时(实际上经常)是“组经理”做的

我们有专门用于此的特殊硬件(一个 Intel 和一个 IBM/AIX 机器),除了磁盘空间之外的所有东西的规格都很低,因为我们不需要在恢复的主机上运行任何真实的东西。

前几轮做了很多工作,但它使我们简化了恢复过程,这是备份的重要部分。


Wer*_*reW 7

由于您似乎指的是管理员没有注意到备份作业“中断”,而不是工作备份无法正常工作,因此我建议围绕备份构建某种监视脚本。

在构建本地备份解决方案时,我会这样做:

  • 构建一个脚本来备份您的数据。
  • 执行测试恢复以确保脚本正常工作。
  • 在脚本中,或通过其他方式,实现一种跟踪备份状态(成功、失败、运行、未运行)的方法。
  • 监控跟踪状态(电子邮件、数据库等)

一旦所有这些都完成了,你应该没问题。要做的另一件事是执行定期测试恢复。如果你有额外的硬件可以捐赠给这个事业。

我工作的地方有一个暖站,每个月我们随机选择一个系统或数据库,然后去暖站对裸机进行测试恢复练习,以确保能够恢复我们的数据。

老实说,如果您的数据对您非常重要,那么投资一些软件来为您管理备份将符合您的最大利益。有数百种产品可供选择,从廉价和简单到企业级。

如果您依靠在 crontab 中运行的一组手写脚本来进行公司备份,那么您迟早可能会被烧毁。