Joh*_*man 2 network-attached-storage amazon-web-services big-data
我听说某些“大数据”应用程序(例如 Hadoop、Cassandra、Solr)建议远离 AWS 托管,因为 EC2 实例通常使用网络附加存储(尽管最近有一些高 i/o 实例,但它们是显然很贵)。
对我来说,NAS 会带来相当不错的性能影响是有道理的,但有多少呢?既然 AWS 存在,那么大概有很多在这种类型的环境中有意义的应用程序示例,但是确定特定应用程序是否适合 AWS 和 NAS 的良好经验法则是什么?(除了坚持使用 AWS 并试用它。)
存储延迟将是您的指标。
如果您的应用程序对存储延迟高度敏感,您将希望避开 AWS 并转向物理,或者花钱购买存储优化实例。他们特别指出这些是 Hadoop 和 Cassandra 之类的类型。
AWS 实例类型的更高层的问题在于它不是 NAS,它更像是 NAS 支持的物理。细节不清楚,但是当您为集群优化实例驱动存储优化时,您离硬件更近了。