我写了一个Hadoop Map Reduce工作.当我在本地运行它时,我注意到如果我没有指定任何reduce任务,则会有一些临时文件写入输出目录.如果我指定reducers,则不会写入临时文件.这是正常的行为吗?我希望看到写入临时文件否则意味着映射器试图在内存中执行所有操作然后转移到内存中的reducer.这让我感到难以置信.
关于映射器如何/何时/何处将中间输出写入文件系统的任何见解将不胜感激.
谢谢
| 归档时间: |
|
| 查看次数: |
3242 次 |
| 最近记录: |