Win*_*ton 41
为了以Hadoop方式处理对象.例如,hadoop使用Text
而不是java String
.在Text
Hadoop中类是类似于Java String
,但是,Text
实现接口等Comparable
,Writable
和WritableComparable
.
这些接口都是MapReduce所必需的; 该Comparable
接口用于比较reducer对键进行排序,并将Writable
结果写入本地磁盘.它不使用java,Serializable
因为java Serializable
对于hadoop来说太大或太重,Writable
可以以非常轻的方式序列化hadoop对象.
Vid*_*dya 30
因为在大数据世界中,需要将结构化对象序列化为字节流,以便通过网络移动或持久保存到群集上的磁盘......然后根据需要再次反序列化.当您拥有像Facebook规模那样存储和移动的大量数据时,您的数据需要高效,并且尽可能少地存储和移动时间.
String
而且Integer
太"肥胖"了.Text
并且IntWritable
,分别在表示相同类型信息的字节数组之上提供更容易的抽象.
归档时间: |
|
查看次数: |
25007 次 |
最近记录: |