linux 上更温和的备份

Stu*_*son 3 linux backup rhel4

本周早些时候,我的服务器遇到了“完美风暴”时刻:两个备份作业(系统上的每个 RAID10 阵列一个)已经持续了 18 个小时,然后我们的 I/O 流量持续激增密集应用。结果是性能低得令人无法接受,我不得不强迫我们的管理员取消备份。(他对此很不高兴……一点也不。 “如果……我不负责”

最终的结果是压力很大,客户不满意,Stu 脾气暴躁。

瓶颈是磁盘利用率。一旦作业被取消,一切都运行得很好。 我可以向我的管理员建议什么来减轻对我的服务器的影响?

以下是一些血腥的细节:

备份命令本身(我从ps.

bpbkar -r 1209600 -ru root -dt 0 -to 0 -clnt xtx-le00 -class F_Full_on_Thursday
-sched Incr_Fri_to_Wed -st INCR -bpstart_to 300 -bpend_to 300 -read_to 300 
-blks_per_buffer 127 -stream_count 8 -stream_number 8 -jobgrpid 223932 -tir -tir_plus 
-use_otm -use_ofb -b svr_1259183136 -kl 28 -fso
Run Code Online (Sandbox Code Playgroud)

系统

  • RHEL4 64 位
  • 4GB RAM(应用程序使用~一半)
  • DL380G5 带有两个连接的 SAS RAID10 分区,~550GB 和 ~825GB

数据

  • 1TB

  • 约 1000 万个文件

应用程序

  • 工作日 0900 到 2300 忙
  • I/O 密集型(99% 读取)主要集中在几百 MB 的文件上

pjc*_*c50 8

我们有一个系统,我们将实时服务器同步到备份服务器(由廉价的 1TB SATA 磁盘构建),然后对备份服务器进行完整的磁带备份。它很棒:

  • 腰带背带 - 两种备份的所有优点
  • 大大减少了实时服务器上的 IO 负载
  • 如果您只需要一两个文件,则恢复速度更快
  • 用于异地存档的全套磁带