是什么让云存储(Amazon AWS、Microsoft Azure、google Apps)与传统数据中心存储网络(SAN 和 NAS)不同?

Ber*_*kay 8 cloud-computing network-attached-storage storage-area-network direct-attached-storage cloud-storage

因为我的问题而有些困惑,所以为了简单起见:

“大型云提供商使用什么样的存储,为什么?”

据我了解,但我无法在典型数据中心和云之间找到任何官方存储网络差异,所有云提供商都使用不同于典型数据中心的 DAS。

甚至 DAS 也比 SAN 或 NAS 有许多缺点,我想了解为什么云将 DAS 用于存储或应用程序的详细信息。

任何资源或描述将不胜感激,让我清楚。

编辑:在阅读论文“大规模云构建的网络挑战和结果方法,David Bernstein 和 Erik Ludvigson(思科)”时,他们提到,

奇怪的是,我们没有看到使用 NAS 或 SAN 的主要提供商的云。典型的云架构使用 DAS,这不是典型的数据中心存储方法。

但是这里有一个冲突:在我看来,并且在本文后面也有说明,云应该使用 SAN 或 NAS,因为当 VM 移动到另一台服务器但仍需要访问原始服务器的存储时,DAS 不合适。

影响云选择 DAS、NAS 或 SAN 的其他原因是什么?大型云提供商使用什么样的存储,为什么?

小智 4

问题澄清后,此答案已被编辑。

影响云选择 DAS 的其他原因有哪些

其中“DAS”表示直接连接存储,即 SATA 或 SAS 硬盘驱动器。

云供应商都使用 DAS,因为它在性价比方面提供了数量级的改进。这是一个横向扩展的情况。

简而言之,SATA硬盘驱动器和SATA控制器都是廉价商品。它们是大众市场产品,价格非常低。通过使用廉价 SATA 驱动器构建大量廉价 PC,谷歌、亚马逊和其他公司以非常低的价格获得了巨大的容量。然后他们在上面添加自己的软件层。他们的软件可以进行多服务器复制,以提高性能和可靠性、监控、硬件故障后重新平衡复制等。

您可以将MogileFS视为 Google、Amazon 和其他公司用于存储的软件类型的更简单代表。当然,这是一种不同的实现,但它与大型系统有许多相同的设计目标和解决方案。如果您愿意,这里是了解有关GoogleFS 的更多信息的起点。

本文后面提到,云应该使用 SAN 或 NAS,因为当虚拟机移动到另一台服务器时,DAS 不合适

不使用 SAN 有两个原因。

1)价格。 大规模的 SAN 非常昂贵。虽然它们可能是技术上“最佳”的解决方案,但由于成本原因,它们通常不会在超大规模的安装中使用。

2) CAP 定理 Eric Brewer 的 CAP 定理表明,在非常大规模的情况下,您无法在保持可接受的可靠性、容错性和性能的同时保持强一致性。SAN 是在硬件中实现强一致性的尝试。这对于 5,000 台服务器安装来说可能效果很好,但从未被证明适用于 Google 的 250,000 多台服务器。

结果: 到目前为止,云计算供应商选择将维护服务器状态的复杂性推给应用程序开发人员。当前的云产品不为每个虚拟机提供一致的状态。应用服务器(虚拟机)随时可能崩溃并且其本地数据丢失。

每个供应商都有自己的持久存储实现,您应该将其用于重要数据。亚马逊的产品就是很好的例子;MySQLSimpleDB简单存储服务。这些产品本身就体现了 CAP 定理——MySQL 实例具有很强的一致性,但可扩展性有限。SimpleDB 和 S3 的扩展能力非常出色,但只是最终保持一致。