小编xin*_*nit的帖子

使用s3作为fs.default.name或HDFS?

我正在EC2上建立一个Hadoop集群,我想知道如何进行DFS.我的所有数据当前都在s3中,所有map/reduce应用程序都使用s3文件路径来访问数据.现在我一直在研究Amazons EMR是如何设置的,并且对于每个作业流,似乎都设置了名称节点和数据节点.现在我想知道我是否真的需要这样做,或者我是否可以使用s3(n)作为DFS?如果这样做,有什么缺点吗?

谢谢!

hadoop amazon-ec2 amazon-emr

1
推荐指数
1
解决办法
4378
查看次数

标签 统计

amazon-ec2 ×1

amazon-emr ×1

hadoop ×1