分区是确定哪个reducer实例将接收哪些中间键和值的过程.每个映射器必须确定reducer将接收它们的所有输出(键,值)对.对于任何键,无论哪个映射器实例生成它,目标分区都是相同的问题是必要的问题:hadoop如何制作它?使用哈希函数?什么是默认功能?
hash hadoop partitioning
哪一种计算:+,-,*,/是发展最快的Intel X86 CPU?有人告诉我/是最快的,但他没有告诉我为什么.我不知道.可以证明吗?
+
-
*
/
x86
hadoop ×1
hash ×1
partitioning ×1
x86 ×1