我所有的服务器目前都被盐水淹没。是否可以将多盘驱动器中的每个盘片分离、清理、映像并合并到新的虚拟驱动器中以进行数据恢复?
是否有一个很好的命令行实用程序来监视 linux 上的硬盘负载?类似于top
但随后监视磁盘活动 iso cpu 使用情况。
更具体地说,我怀疑对于某些(重负载)服务器,在对其上运行的程序的各个部分进行了多次优化之后,现在的瓶颈只是记录到磁盘上的文件。但是我发现很难评估服务器可以处理多少流量。
我的理想工具是打印“您现在使用了 35% 的磁盘带宽”的工具。有任何想法吗?
我是一个代码猴子,越来越多地为我的小公司承担系统管理员的职责。我的代码就是我们的产品,而且我们越来越多地提供与 SaaS 相同的应用程序。
大约 18 个月前,我将我们的服务器从一家以优质托管为中心的供应商转移到了 IV 级数据中心的准系统机架推进器。(字面意思是在街对面。)这个人自己做的事情更多——比如网络、存储和监控。
作为重大举措的一部分,为了取代我们从托管公司租用的直连存储,我构建了一个基于 SuperMicro 机箱、3ware RAID 卡、Ubuntu 10.04、两打 SATA 磁盘、DRBD 和 . 三篇博文详细记录了这一切:构建和测试新的 9TB SATA RAID10 NFSv4 NAS:第一部分、第二部分和第三部分。
我们还设置了一个 Cacit 监控系统。最近,我们添加了越来越多的数据点,例如 SMART 值。
我不能这样做这一切,而不真棒 挤入 在 ServerFault。这是一次有趣且有教育意义的经历。我的老板很高兴(我们节省了大量的美元),我们的客户很高兴(存储成本下降),我很高兴(有趣,有趣,有趣)。
直到昨天。
午饭后一段时间,我们开始从我们的应用程序(一个按需流媒体 CMS)收到性能缓慢的报告。大约在同一时间,我们的 Cacti 监控系统发送了大量电子邮件。一个更有说服力的警报是 iostat await 的图表。
性能变得如此下降以至于 Pingdom 开始发送“服务器关闭”通知。整体负载适中,没有流量高峰。
在登录应用服务器、NAS 的 NFS 客户端后,我确认几乎所有东西都在经历高度间歇性和超长的 IO 等待时间。一旦我跳到主要 NAS 节点本身,在尝试导航问题阵列的文件系统时,同样的延迟很明显。
是时候进行故障转移了,一切顺利。在 20 分钟内,一切都被确认备份并完美运行。
在任何和所有系统故障后,我都会进行事后分析以确定故障原因。我做的第一件事是 ssh 回到盒子里并开始查看日志。它完全离线。是时候去数据中心旅行了。硬件复位,备份并运行。
在/var/syslog
我发现这个可怕的条目:
Nov …
Run Code Online (Sandbox Code Playgroud) 我们公司有很多个人电脑,没有人愿意擦除大量硬盘驱动器。我们也有很多学徒工具制造商,他们真的很想破坏东西。因此,每隔几个月,我们的学徒就会收到两个沉重的硬盘篮子进行钻探。
我的一些同事认为这绝对是矫枉过正。但是,我相信在钻取驱动器之前不擦除驱动器可能会使一些数据恢复。
根据这个问题,用DBAN擦除会使数据完全无法恢复。
DBAN 很好。这是一个肮脏的小秘密——任何覆盖驱动器每个字节的程序都将永久擦除所有内容。您不需要使用不同的写入模式进行多次传递等。
钻个洞怎么样?
这听起来像是一个奇怪的问题,但它引起了我与一些同事的热烈讨论。考虑一个由八个或十二个磁盘组成的中等大小的 RAID 阵列。在购买第一批磁盘,或购买替换磁盘以扩大阵列或更新硬件时,可以采用两种广泛的方法:
显然有一些中间立场,但这些是主要的对立心态。我一直很好奇哪种方法在降低阵列灾难性故障的风险方面更明智。(让我们定义为“25% 的磁盘在等于重新同步阵列一次所需的时间窗口内发生故障。”)逻辑是,如果所有磁盘来自同一个地方,它们可能都具有相同的潜在的缺陷等待打击。如果你愿意,同样的定时炸弹与时钟上的相同初始倒计时。
我为每种方法收集了一些更常见的优缺点,但其中一些感觉像是猜测和直觉,而不是基于确凿证据的数据。
如果我们仅按要点计数,“批量购买”显然会获胜。但是一些优点很弱,而一些缺点很强。许多要点只是简单地说明了其他一些要点的逻辑逆。其中一些事情可能是荒谬的迷信。但是,如果迷信在维护阵列完整性方面做得更好,我想我会愿意接受它。
哪一组在这里最明智?
更新:我有与此讨论相关的数据。我个人构建的最后一个阵列(大约四年前)有八个磁盘。我从一个供应商处订购,但将购买分成两个订单,每个订单四个磁盘,相隔大约一个月。阵列的一个磁盘在运行的最初几个小时内发生故障。它来自第一批,并且该订单的退货窗口在所有东西都旋转起来的时间内已经关闭。
四年后,七个原始磁盘加上一个替换磁盘仍然没有错误地运行。(敲木头。)
问题
我已经阅读了很多关于存储的讨论,以及 SSD 还是经典 HDD 更好。我很困惑。HDD 仍然很受欢迎,但为什么呢?
哪个更适合主动存储?例如对于数据库,磁盘一直处于活动状态?
关于固态硬盘。
优点。
缺点。
题。
关于硬盘。
优点。
缺点。
仅仅是价格吗?为什么首选硬盘驱动器?SSD 真的对服务器有用吗?
是否有任何研究或证据表明,在设备的使用寿命内,水平安装硬盘驱动器比垂直安装更好?或颠倒,或任何方向。
IBM 今天仍在开发和销售磁带驱动器。它们的容量似乎与现在的硬盘不相上下,但搜索时间和传输速率都明显低于硬盘。
那么,现在什么时候磁带驱动器比硬盘驱动器(或 SSD)更可取呢?
今天我在我的机器上用 OpenSUSE 12.3(内核 3.7)尝试了这个:
# resize2fs /dev/mapper/system-srv 2G
resize2fs 1.42.6 (21-Sep-2012)
Filesystem at /dev/mapper/system-srv is mounted on /srv; on-line resizing required
resize2fs: On-line shrinking not supported
Run Code Online (Sandbox Code Playgroud)
/dev/mapper/system-srv
是 EXT4 卷。
它真的不受支持还是我遗漏了什么?