Hadoop中org.apache.hadoop.mapreduce.Mapper.run()函数的用途是什么?

Pra*_*ati 8 hadoop function map

org.apache.hadoop.mapreduce.Mapper.run()Hadoop 中该功能的用途是什么?在setup()调用之前调用map(),在clean()调用之后调用map().run()说的文件

专家用户可以覆盖此方法,以更全面地控制Mapper的执行.

我正在寻找这个功能的实际目的.

Bri*_*ach 10

默认run()方法只接受上下文提供的每个键/值对并调用map()方法:

public void run(Context context) throws IOException, InterruptedException {
    setup(context);
    while (context.nextKeyValue()) {
       map(context.getCurrentKey(), context.getCurrentValue(), context);
    }
    cleanup(context);
}
Run Code Online (Sandbox Code Playgroud)

如果你想做更多的事情......你需要覆盖它.例如,MultithreadedMapper