hadoop问题

kum*_* MI 2 hadoop

我想验证以下示例问题的答案

问题1

您可以使用hadoop fs -put命令将sales.txt添加到HDFS.此文件足够小,可以放入单个块中,该块将复制到群集中的三个节点.在其中一个节点发生故障后,集群何时以及如何处理复制?

答:群集不会尝试重新复制此块.
B.此块将立即重新复制,群集上的所有其他HDFS操作将在此过程中暂停.
C.该块将保持不足,直到管理员手动删除并重新创建该文件.
D.在NameNode根据从DataNode接收的块报告确定文件未被复制后,将自动重新复制该文件.

我相信答案是D

问题2

您需要编写代码来执行需要几个步骤的复杂计算.您已决定将这些作业链接在一起,并为存储中间计算结果的键开发自定义复合类.该密钥必须实现哪个接口?

A.可写
B. 可转让
C. CompositeSortable
D. WritableComparable

我相信答案是D

问题3

您正在开发一个使用一年的密钥的应用程序.哪个Hadoop提供的数据类型最适合代表一年的密钥?

A.文本
B. IntWritable
C. NullWritable
D. BytesWritable
E.这些都不合适.您需要实现自定义密钥.

我相信答案是B.

Eng*_*iro 7

1 - 正确,您可以在任何描述HDFS容错的文献中找到它.Hadoop:The Definitive Guide的第3章中有一节描述了客户端向HDFS写入数据的过程,并描述了这种失败过程如何发挥作用.

2 - 正确,键必须可写可比较,以便它们不属于可能包含数组和其他不可比类型的其他类别.

3 - 正确,一年是一个数值,因此在所有这些中,最适用的选项是可以写入的.