我会稍微定义MapR.它不使用HDFS,而是使用NFS接口提供自己的分布式文件系统.其中,HDFS也基于本地FS.
主要的不同之处在于HDFS不是Posix和其他设计选择.
1. MapR是HDFS不可变的.它可以被视为有利,特别是如果你需要它.
2. MapR时无法安装HDFS.您可以使用任何使用Linux FS的现有工具.
与posix无关:MapR具有较小的块大小而不是单点故障(NameNode).MapR具有多站点复制.
让我们看看黑暗的一面:a)拥有可变数据(而不是不可变的HDFS)会使系统更加复杂.
b)不知道(至少对我来说)在大型集群上工作.(我听说过几百个节点).
c)从架构点(具有小块)我不确定如何实现良好的数据局部性.
| 归档时间: |
|
| 查看次数: |
11027 次 |
| 最近记录: |