Cliffhanger:备份是对的……在这里……对吧?

And*_*mar 28 backup

在我的工作中,备份的优先级低得惊人。备份策略是在不久前实施的,从那时起就假设备份没问题。如果您询问系统管理员,他们会说所有内容都已备份。

但是,当您要求特定备份时,有一半时间它们都不在:

  • 磁盘已满
  • 磁带失败
  • 似乎有人禁用了备份作业
  • 网络连接有停机时间
  • 我们几年前订购了那个磁盘,但财务部门没有批准采购订单
  • 文件已损坏
  • 文件包含错误的数据库
  • 只有事务日志备份(没有完整的就没有用)

几周前,灾难真的来临了,因为其中一台服务器丢失了太多的 RAID 磁盘。幸运的是,如果您尝试了很多次,一张磁盘仍然足以复制数据。

但即使在那次近乎灾难之后,我似乎也无法说服系统管理员改善这种情况。所以我想知道,有什么让人们睁开眼睛的秘诀吗?在我看来,我们正沿着悬崖边走。

Osk*_*orn 24

你总是必须从头开始解决这些问题。

当前的备份策略是否得到管理层的支持和理解?如果没有,那就没用了。

执行管理层需要了解问题和所涉及的风险(丢失您需要合法提供才能生存的财务数据,或需要多年收集的客户数据?)并在决定行动或决定让某人(如您)采取行动。

如果您无法进入管理层,请尝试业务控制员或其他财务职位,其中数据检索及其完整性对公司的报告非常重要。如果需要,他们反过来可以“开始风暴”......


Pow*_*101 14

从哪里开始?这是一场等待发生的灾难。系统管理员的主要工作职能是确保数据得到备份和恢复。其他一切都是次要的。不,如果不是,但是。

您可以执行以下操作:

  1. 跟踪用于还原的 KPI。应该可以生成一份报告,显示有多少恢复请求已成功。任何低于 100% 的情况都应进行彻底调查。管理层喜欢报道,这是确凿的证据。

  2. 应该有所有备份和恢复操作的文档化程序,包括所有系统及其备份策略、磁带轮换、计划、升级路径、测试恢复等。要求查看它们。

  3. 与系统管理员的经理交谈并表达您的担忧。拿出证据证明恢复不起作用。如果没有快乐就更高。

说真的 - 大惊小怪。这样的事情可以摧毁一个公司。


aha*_*den 5

建议(至少)每年进行一次灾难恢复测试。成功执行测试所需的工作应揭示缺点。


gbj*_*anb 5

在我工作的地方,我们有一个非常出色的 IT 部门,他们每年都从欧洲各地的每个办事处聚集在一起,在数据中心的租用服务器上举办“恢复盛会”,有效地模拟如果有一天员工上班并发现办公室在夜间被烧毁。

让大老板参与进来,提醒他,如果灾难发生,那一年他将没有奖金(或更糟!),所以也许组织一次类似的灾难恢复练习是明智的。这不应该花费很长时间或花费太多 - 管理员会收到他们的异地备份磁带,并被告知要从他们那里调出相同的办公环境。

然后坐下来观察 IT 变得更好 - 一旦管理层意识到公司数据危险地接近于永久丢失,火花就会飞扬(来自将战略性地放置在所述管理员的火箭)