如何将大数据公共数据集导入AWS?

she*_*ven 3 amazon-ec2 amazon-ebs bigdata amazon-web-services amazon-simpledb

加载任何亚马逊列出的公共数据集(http://aws.amazon.com/datasets)将占用大量资源和带宽.将它们导入AWS的最佳方法是什么,以便您快速开始使用它们?

bar*_*iir 5

您需要使用公共数据集的Snapshot-ID创建新的EBS实例.这样你就不需要支付转账费用了.

但要小心,一些数据集仅在一个区域中可用,很可能用与此类似的注释表示.您应该在同一区域注册您的EC2实例.

这些数据集托管在us-east-1区域.如果您从其他地区处理这些,您将需要支付数据传输费.