目前我正在使用 rsnapshot 在外部磁盘上实现每日/每周/每月备份方案。最近,我一直在阅读很多关于像 zfs 和 btrfs 这样的写时复制文件系统。我非常喜欢存储快照以回到过去的能力。
以下用于创建每日备份历史记录的方法是否存在严重缺陷?
我负责下载和处理大量财务数据。每个交易日,我们必须添加大约 100GB。
为了处理如此大量的数据,我们从我们大学的数据中心租用了一台虚拟服务器(3 个内核,12 GB 内存)和一个 30 TB 的块设备。
在虚拟机上,我在 Linux 上安装了 Ubuntu 16.04 和 ZFS。然后,我在 30TB 块设备上创建了一个 ZFS 池。使用 ZFS 的主要原因是压缩功能,因为数据可以很好地压缩 (~10%)。请不要对我太苛刻,因为我没有遵循 ZFS 希望看到裸机的黄金法则,我被迫按原样使用基础设施。
发帖的原因是我面临写入速度差的问题。服务器能够以大约 50 MB/s 的速度从块设备读取数据,但写入数据的速度非常慢,大约为 2-4 MB/s。
以下是有关池和数据集的一些信息:
zdb
tank:
version: 5000
name: 'tank'
state: 0
txg: 872307
pool_guid: 8319810251081423408
errata: 0
hostname: 'TAQ-Server'
vdev_children: 1
vdev_tree:
type: 'root'
id: 0
guid: 8319810251081423408
children[0]:
type: 'disk'
id: 0
guid: 13934768780705769781
path: '/dev/disk/by-id/scsi-3600140519581e55ec004cbb80c32784d-part1'
phys_path: '/iscsi/disk@0000iqn.2015-02.de.uni-konstanz.bigdisk%3Asn.606f4c46fd740001,0:a'
whole_disk: 1
metaslab_array: 30
metaslab_shift: 38
ashift: 9
asize: 34909494181888
is_log: 0 …Run Code Online (Sandbox Code Playgroud) 通常建议采用每日/每周/每月备份方案进行备份。据我了解 rsnapshot,由于硬链接,备份非常便宜。
说有什么好处吗
retain daily 7
retain weekly 4
retain monthly 12
Run Code Online (Sandbox Code Playgroud)
相比
retain daily 365
Run Code Online (Sandbox Code Playgroud)
如果每个新备份只占用一点磁盘空间?