有人可以举例说明地图中的中位数/分位数的计算吗?
我对Datafu中位数的理解是'n'映射器对数据进行排序并将数据发送到"1"reducer,它负责对n个映射器中的所有数据进行排序并找到中位数(中间值)我的理解是否正确?
如果是这样,这种方法是否适用于大量数据,因为我可以清楚地看到单个减速器正在努力完成最终任务.谢谢
statistics hadoop mapreduce apache-pig median
apache-pig ×1
hadoop ×1
mapreduce ×1
median ×1
statistics ×1