在 NAS 中寻找短期存储的哪些品质?

pos*_*def 4 untagged

背景

我在一个研究生物医学数据的研究部门工作,我们目前正在考虑修改我们的 IT 结构。我们有几种仪器每天生成数 GB 的数据,连接到网络隔离的计算机。数据在网络中传输,在传输到大学的国家数据存储服务之前在中间步骤中进行处理。

我们需要改进的是将数据短期(约 3 个月)存储的中间步骤,在此期间,研究人员可以访问数据,而无需从远程数据中心查询数据。事实上,中间服务器用于许多不同的目的,并且通常会耗尽空间。我们打算购买一个 NAS,专门用于短期存储仪器数据。我被赋予了提出替代方案的责任。

我首先列出了我们需要什么,这导致了我们的以下需求列表:

  • 至少 8TB 空间:这对于现代设置来说应该不是问题
  • Gb带宽:同上
  • 机架安装:这样 NAS 将在物理上靠近我们拥有的其他服务器
  • 可扩展:以防我们的数据量在不久的将来增加(我认为会)
  • 最少的维护:我们没有(在经济上和官僚上)拥有全职系统管理员的自由,因为它是最精通技术的科学家帮助服务器维护。我们都不是 IT 专业人员...

问题)

我开始阅读存储系统,关于元的最常见问题列表是一个很好的资源。同样,我发现了两个类似的问题,询问研究环境中的存储:

然而,这两个问题似乎都集中在长期存储上,也集中在单个设备上,而我最感兴趣的是弄清楚在这种情况下哪些功能/规格/质量是有价值的。

根据先前的知识和最近的阅读,我认为在我们的案例中选择 NAS 时,有几个方面可能很重要:

  • 支持 SAS 驱动器- 这真的很重要吗?我知道 SAS 驱动器的质量通常更高,但假设阵列中有冗余,如果 SATA 磁盘死亡有什么大不了的?

  • 链路聚合- 我不得不说我不太了解与之相关的网络层和设备,但我对链路聚合的有限理解是,使用多个网卡,理论上 NAS 可以将带宽增加一倍/三倍,同样多个链接用于纠错(至少根据 Synology 的说法)。如果您有任何其他信息可以帮助我理解这一点并将现实与营销谈话区分开来,我将不胜感激。

  • 多个网络- 由于我们在某些计算机上的隔离标准,我们可以在两个不同的 VLAN 中使用 NAS,这两个 VLAN 互不可见,这对我们来说是有意义的。如果 NAS 有两个以太网端口,是否像将其连接到两个不同的网络并完成它一样简单?

  • 热插拔等- 这方面似乎有许多不同的版本。我的理解是热插拔是指连接到 NAS 的额外磁盘,当一个磁盘出现故障时首先写入该磁盘。这样对吗?如果是这样,热插拔是一项很酷的功能,还是即使阵列运行单/双冗余也是必须的?

  • 另一个版本的“热插拔”(我不确定它是如何命名的)允许在服务器在线时更换磁盘,所以它是一种热更换(Drobo 提供了类似的东西)。它是通用功能还是 Drobo 特有的功能?是否有类似的技术可用?是否有我可能不知道的“捕获”?否则我认为这很有趣,因为它允许在线扩展存储空间。

上面的功能列表是我一直在思考的一些功能,我真的很感激对这些功能的一些见解,以及我可能错过的其他功能。

eww*_*ite 5

购买基于ZFS 的设备。任何使用NexentaStor 的东西都是一个好的开始,但您听起来好像也需要/需要供应商支持。

PogoStorage StorageDirector这样的东西可以工作。
另一个不错的罐头选项是DataON NexentaStor产品。

这两家供应商都可以根据您的存储和性能需求分析和定制解决方案。这不是一个罕见的要求,因此与了解您的领域的供应商交谈会有所帮助。

为什么是 ZFS?

  • 出色的容量和性能可扩展性。
  • 智能缓存。这与您的特定应用程序有关。工作数据集可以在更快的存储层 (SSD) 上增加。这是 ZFS L2ARC 缓存。
  • 如果您通过 NFS 或 CIFS 挂载,则可以进行写入加速。ZFS ZIL 设备使这成为可能。
  • 它具有令人难以置信的弹性

所有的复选标记都被击中:

  • SAS 驱动器。是的。它们比基于 SATA 的解决方案更重要且更稳定
  • 链路聚合。当然。如果有很多消费者,我更喜欢从存储单元到交换机的 10GbE。10GbE 端到端甚至更好,具体取决于您预期的工作负载。
  • 多个网络当然是可能的。考虑从存储阵列到交换机的中继。
  • 热插拔驱动器。这是给定的。它允许您在系统运行时交换磁盘。但是,在该容量级别,您可能还需要一个热备用驱动器,如果驱动器出现故障,它将立即被调用。