小编Bis*_*swa的帖子

如何使用hadoop mapreduce编程计算文件中特定单词的出现次数?

我正在尝试使用 java 中的 hadoop mapreduce 编程来计算文件中特定单词的出现次数。文件和单词都应该是用户输入。所以我试图将特定单词作为第三个参数与 i/p 和 o/p 路径(In, Out, Word)一起传递。但是我无法找到将单词传递给 map 函数的方法。我尝试了以下方法,但没有奏效: - 在映射器类中创建了一个静态字符串变量,并将我的第三个参数(即要搜索的单词)的值分配给它。然后尝试在 map 函数中使用这个静态变量。但是在 map 函数内部,静态变量的值是 Null。我无法在 map 函数中获得第三个 arument 的值。

无论如何要通过 JobConf 对象设置值?请帮忙。我在下面粘贴了我的代码。

public class MyWordCount {

    public static class MyWordCountMap extends Mapper < Text, Text, Text, LongWritable > {
        static String wordToSearch;
        private final static LongWritable ONE = new LongWritable(1L);
        private Text word = new Text();
        public void map(Text key, Text value, Context context)
        throws IOException, InterruptedException {
            System.out.println(wordToSearch); // …
Run Code Online (Sandbox Code Playgroud)

java hadoop mapreduce

2
推荐指数
1
解决办法
7116
查看次数

标签 统计

hadoop ×1

java ×1

mapreduce ×1