我们是一家从事视频编辑等工作的小公司,需要一个地方来保存大型媒体文件的备份副本并使其易于共享。
我有一个装有 Ubuntu Server 和 4 个 500 GB 驱动器的盒子。他们目前将 Samba 设置为四个共享文件夹,Mac/Windows 工作站可以很好地看到这些文件夹,但我想要一个更好的解决方案。这有两个主要原因:
因此,我需要一种方法来组合硬盘驱动器,以避免由于单个驱动器故障而导致数据完全丢失,因此用户在每台服务器上只能看到一个共享。我已经完成了 linux 软件 RAID5 并且对它有不好的体验,但会再试一次。LVM 看起来不错,但似乎没有人使用它。ZFS 看起来很有趣,但它相对“新”。
什么是最有效和风险最小的方法来组合对我的用户来说方便的硬盘?
编辑:这里的目标基本上是创建包含任意数量硬盘但从最终用户角度限制复杂性的服务器。(即他们看到每台服务器一个“文件夹”)备份数据在这里不是问题,但每个解决方案如何响应硬件故障是一个严重的问题。这就是为什么我将 RAID、LVM、ZFS 和谁知道是什么混为一谈的原因。
我之前使用 RAID5 的经验也是在 Ubuntu Server 机器上进行的,并且有一组棘手且不太可能的情况导致数据完全丢失。我可以再次避免这种情况,但感觉我正在向系统添加一个不必要的额外故障点。
我没有使用过 RAID10,但我们使用的是商品硬件,每盒最多的数据驱动器几乎固定在 6 个。我们有很多 500 GB 驱动器,1.5 TB 非常小。(不过,仍然是至少一台服务器的选项)
我没有使用 LVM 的经验,并且阅读了关于它如何处理驱动器故障的相互矛盾的报告。如果(非条带化)LVM 设置可以处理单个驱动器故障,并且只丢失存储在该驱动器上的文件的一部分(并且仅将大多数文件存储在单个驱动器上),我们甚至可以接受。
但是只要我必须学习一些全新的东西,我还不如一路走上 ZFS。但是,与 LVM 不同的是,我还必须更改我的操作系统 (?),以便增加我所在位置和我想要所在位置之间的距离。不过,我在 uni 使用了一个版本的 solaris,但并不介意。
在 IT 领域的另一端,我想我也可以探索 FreeNAS 和/或 Openfiler,但这并不能真正解决如何组合驱动器的问题。
我的机器中有几个 SATA 硬盘 RAID 以确保安全,因为我担心驱动器出现某种机械故障并丢失我的数据。我正在考虑在明年价格有所上涨时改用 SSD。
是否值得将 RAID 与 SSD 一起使用?使用 SSD 似乎可以消除机械故障的主要原因,因此您基本上是在用“SSD 故障的可能性”换取“便宜的主板 RAID 控制器故障的可能性”。我不确定这是否值得。
意见?
一位朋友正在和我谈论位腐烂的问题 - 驱动器上的位随机翻转,破坏数据。非常罕见,但如果有足够的时间,它可能会成为一个问题,并且不可能被发现。
驱动器不会认为它是坏扇区,备份只会认为文件已更改。不涉及校验和来验证完整性。即使在 RAID 设置中,也会检测到差异,但无法知道哪个镜像副本是正确的。
这是一个真正的问题吗?如果是这样,可以做些什么呢?我的朋友推荐 zfs 作为解决方案,但我无法想象在工作中扁平化我们的文件服务器,安装 Solaris 和 zfs ..
我最近研究了用于数据冗余和可用性的高级文件系统(Btrfs、ZFS),并对它们提供的附加功能感兴趣,尤其是它们针对数据损坏的“自我修复”功能。
但是,我认为我需要退后一步,尝试了解与传统的 mdadm-Raid1 + 相比,对于一般家庭/SMB 使用而言,这种好处是否超过了它们的缺点(Btrfs 错误和未解决的问题以及 ZFS 可用性和性能影响) Ext4 解决方案。无论哪种方式都可以使用镜像备份。
假设我有几个文件服务器用于存档目的并且资源有限,但是有 ECC 内存和稳定的电源。
我有两个 500 GB 磁盘,昨天我使用软件 RAID 1 将第一个驱动器镜像到第二个驱动器。
PC现在已经运行了30个小时。两个磁盘都显示“重新同步”,但没有进度指示器。此外,两个磁盘上都有一个黄色的小感叹号。
我的问题是:
我在 IT 工作了很多年,所以我知道什么是 RAID 阵列,什么是 RAID 0,RAID 1、5、6、10、50、60 等,但最近突然想起工作中的谈话;如果 RAID 代表独立(或廉价)磁盘的冗余阵列,那么为什么 RAID 0 被归类为 RAID 而不仅仅是条带阵列?
将数据在一个阵列上的多个磁盘上进行条带化不会提供任何冗余,那么为什么将其归类为 RAID 阵列呢?当然最低的数字应该是 RAID 1(镜像),因为那是冗余真正开始的时候?
FakeRaid 上的Ubuntu wiki 页面说明如下:
[A] 一些硬件产品……声称是 IDE 或 SATA RAID 控制器……实际上这些都不是真正的硬件 RAID 控制器。相反,它们只是结合了特殊 BIOS 配置选项的多通道磁盘控制器......
是否有一种典型的方法来识别(从产品规格)主板是否具有“真正的”RAID,或者消费者通常无法获得“真正的”RAID 产品?
人们一直告诉我,为了提高 SQL 服务器的性能,购买尽可能快的 RAID 5 硬盘等。
所以我在想,与其把所有的钱都花在 RAID 5 和超级快速的硬盘上(顺便说一句,这并不便宜),为什么不直接获得大量 RAM?我们知道 SQL 服务器将数据库加载到内存中。内存比任何硬盘都快。
为什么不在服务器上塞入 100 GB 的内存?那么就使用带有RAID 1 的普通SCSI 硬盘。那不是更便宜和更快吗?
在我看来,由于 RAID 卷是逻辑的(而不是物理的),操作系统认为它们的布局可能与实际的物理布局不符。
那么碎片整理对 RAID 有意义吗?
我听过/读过关于各种突袭风格的不同性能故事。我很好奇商定的最佳答案是什么。
raid ×10
hard-drive ×2
linux ×2
performance ×2
defrag ×1
fakeraid ×1
file-server ×1
filesystems ×1
hardware ×1
mdadm ×1
memory ×1
raid0 ×1
sql ×1
ssd ×1
ubuntu ×1
windows-7 ×1
zfs ×1