我建议这是一个关于企业级存储区域网络的规范问题。
什么是存储区域网络 (SAN),它是如何工作的?
它与网络附加存储 (NAS) 有何不同?
与直连存储 (DAS) 相比有哪些用例?
哪种方式更好或更差?
为什么这么贵?
我(或我的公司)应该使用一个吗?
FakeRaid 上的Ubuntu wiki 页面说明如下:
[A] 一些硬件产品……声称是 IDE 或 SATA RAID 控制器……实际上这些都不是真正的硬件 RAID 控制器。相反,它们只是结合了特殊 BIOS 配置选项的多通道磁盘控制器......
是否有一种典型的方法来识别(从产品规格)主板是否具有“真正的”RAID,或者消费者通常无法获得“真正的”RAID 产品?
互联网上有很多关于 Unix 服务器分区的相互矛盾的信息,所以我需要一些关于如何进行的建议。
到目前为止,在我们测试环境中的服务器上,我并不真正关心分区,我配置了单个整体/和交换分区。这种分区方案对于我们的生产服务器来说似乎不是一个好主意。我在这里找到了一个很好的起点,但在细节上似乎很模糊。
基本上,我有一台服务器,我将在该服务器上运行基本的 LAMP 堆栈(Apache、PHP 和 MySQL)。它将必须处理文件上传(最多 2GB)。该系统具有 2TB RAID 1 阵列。
我打算设置:
/ 100GB
/var 1000GB (apache files and mysql files will be here),
/tmp 800GB (handles the php tmp file)
/home 96GB
swap 4GB
Run Code Online (Sandbox Code Playgroud)
这听起来很理智,还是我把事情复杂化了?
我已经看到列出的这两个,都在多个驱动器上进行了条带化和镜像,但是我没有注意到它们之间的区别吗?
我们有一台运行 CentOS 的 Dell PowerEdge T410 服务器,其 RAID-5 阵列包含 5 个希捷 Barracuda 3 TB SATA 磁盘。昨天系统崩溃了(我不知道具体是怎么回事,也没有任何日志)。
启动到 RAID 控制器 BIOS 后,我看到在 5 个磁盘中,磁盘 1 标记为“丢失”,磁盘 3 标记为“降级”。我强制备份磁盘 3,并用新硬盘驱动器(相同大小)替换磁盘 1。BIOS 检测到这一点并开始重建磁盘 1 - 但是它卡在了 %1。旋转进度指示器整晚都没有移动;完全冻结。
我在这里有哪些选择?除了使用一些专业的数据恢复服务,还有什么方法可以尝试重建?两个硬盘怎么会同时出现故障?似乎过于巧合。是否有可能是磁盘 1 发生故障,从而导致磁盘 3“不同步”?如果是这样,是否有任何实用程序可以用来“同步”恢复它?
我最近一直在研究 RAID5 与 RAID6,我一直看到 RAID5 不再足够安全,因为 URE 等级和驱动器的大小不断增加。基本上,我发现的大部分内容都说,在 RAID5 中,如果磁盘出现故障,如果阵列的其余部分为 12TB,那么您几乎有 100% 的机会遇到 URE 并丢失数据。
12TB 的数字来自这样一个事实,即磁盘的额定读取率为 10^14 位以达到一个 URE。
好吧,有些事情我没有得到。读取是由磁头在扇区上完成的,导致读取失败的原因是磁头死亡或扇区死亡。也可能是因为其他原因读数不起作用(我不知道,就像振动使头部跳动......)。所以,让我解决所有 3 种情况:
如您所见,从我确定的 3 个故障点来看,没有任何意义。那么到底什么是URE,我的意思是具体的?
有人可以向我解释一下吗?
编辑 1
在第一波答案之后,似乎原因是该部门失败了。好消息是固件、RAID 控制器和操作系统 + 文件系统有适当的程序来及早检测并重新分配扇区。
好吧,我现在知道什么是 URE(实际上,这个名字是不言自明的 :))。
我仍然对根本原因感到困惑,主要是他们给出的稳定评级。
有些人将失败的扇区归因于外部来源(宇宙波),然后我感到惊讶的是 URE 率是基于读取计数而不是年龄,宇宙波确实应该对旧磁盘产生更多影响,因为它已被暴露更多,我认为这更像是一种幻想,尽管我可能是错的。
现在是与磁盘磨损有关的另一个原因,有人指出较高的密度会产生较弱的磁畴,这是完全有道理的,我将遵循解释。但是正如这里很好地解释的那样,新的不同大小的磁盘主要是通过在 HDD 机箱中放置或多或少相同的盘片(然后相同的密度)来获得的。扇区是相同的,并且都应该具有完全相同的可靠性,因此较大的磁盘应该比较小的磁盘具有更高的评级,读取的扇区较少,情况并非如此,为什么?这虽然可以解释为什么采用新技术的新磁盘没有比旧磁盘获得更好的评级,仅仅是因为更好的技术收益被更高密度造成的损失所抵消。
在我们的商店中,我们在所有工作站中都忠实地使用 RAID,可能只是因为这似乎是应该这样做的方式。我说的是用于科学模拟的工作站,使用板载 RAID 芯片。
但我听过很多 RAID 的恐怖故事。Stackoverflow 本身也有过由 RAID 控制器间接造成的中断。
RAID 可以保护您免受非常有限的故障类型 - 物理磁盘故障 - 但同时它也引入了额外的故障点。RAID 控制器可能会出现问题,而且经常会出现问题。至少在我们的商店中,RAID 控制器的故障似乎至少与磁盘本身一样频繁。您还可以轻松地在更换故障驱动器的过程中搞砸。
RAID 什么时候值得麻烦?通过向备份解决方案添加更多冗余,您是否会获得更好的投资回报?在这方面,哪种类型的 RAID 更好或更差?
编辑:我已经改变了原来的标题“RAID 值得麻烦吗?”,所以听起来不那么消极
最近我办公室的 Buffalo TeraStation NAS 出现了一个问题,这让我开始调查 Raid 5。
我发现了几篇不同的文章,讨论在大型阵列或大型磁盘中使用 raid 5 的不合适性
我想弄清楚什么算作“大”?
我们这里的 NAS 是一个 4 驱动器 Raid 5 设置,每个驱动器是 1 TB。驱动器发生故障并已更换,阵列当前正在重建。
就重建期间可能会出现问题而言,此设置是否构成如此之大?
这种设置在日常使用中的可靠性如何?
在 Synology Disk Station 上规划我的 RAID 设置期间,我阅读了大量有关各种 RAID 类型的文章,这是一本很棒的读物:RAID 级别和URE(不可恢复的读取错误)的重要性。
但是,我还不清楚一件事:
让我们有两个场景:
两种情况的相同假设:
发生什么了?使用 99.999 个文件重建 RAID 是否正常而 1 个文件丢失?还是我会丢失所有 100.000 个文件?
如果答案需要文件系统类型的知识,假设它是 BTRFS 或 ZFS 作为文件系统。
raid ×8
storage ×4
linux ×2
raid5 ×2
database ×1
fakeraid ×1
hard-drive ×1
partition ×1
redundancy ×1