小编abb*_*inn的帖子

Hadoop fsck显示丢失的副本

我正在运行带有两个datanode和一个namenode的Hadoop 2.2.0集群.当我尝试在namenode或任何datanode上使用hadoop fsck命令检查系统时,我得到以下内容:

Target Replicas is 3 but found 2 replica(s). 
Run Code Online (Sandbox Code Playgroud)

我尝试将配置更改为hdfs-site.xml(dfs.replication为2)并重新启动群集服务.在运行时hadoop fsck /它仍然显示相同的状态:

Target Replicas is 3 but found 2 replica(s).
Run Code Online (Sandbox Code Playgroud)

请澄清,这是一个缓存问题还是一个错误?

hadoop hdfs fsck

5
推荐指数
1
解决办法
2626
查看次数

映射减少插槽定义

我正在成为一名cloudera Hadoop管理员.从我开始,我听到很多关于在Hadoop集群中计算每台机器的插槽,比如定义Map Slots和Reduce插槽的数量.

我已经在互联网上搜索了一个日志时间,以获得Map Reduce Slot的Noob定义,但没有找到任何.

通过PDF解释Map Reduce的配置,我真的很生气.

请解释一下集群机器中计算插槽的确切含义.

hadoop mapreduce cluster-computing job-scheduling cloudera-cdh

5
推荐指数
1
解决办法
5971
查看次数

如何在Hbase中设计Row Key

我正在编写一个将RDBMS转换为HBase的程序.我选择了一个顺序实体作为行密钥,如员工ID(1,2,3 ....),但我在某处读取了行键不应该是一个顺序实体.我的问题是为什么不建议选择顺序行键.做同样的设计前景是什么?

database hbase

3
推荐指数
1
解决办法
5303
查看次数