参数"mapred.min.split.size"会更改先前写入文件的块的大小吗?假设我在启动JOB时传递参数"mapred.min.split.size",其值为134217728(128MB).关于会发生什么事情的说法是正确的?
1 - 每个MAP进程相当于2个HDFS块(假设每个块64MB);
2 - 我的输入文件(以前包括HDFS)将有一个新的划分来占用HDFS 128M中的块;
hadoop hdfs
hadoop ×1
hdfs ×1