标签: mapreduce

好的MapReduce示例

除了"如何使用MapReduce计算长文本中的单词"任务之外,我想不出任何好的例子.我发现这不是给别人一个关于这个工具有多强大的印象的最好例子.

我不是在寻找代码片段,实际上只是"文本"示例.

mapreduce

pag*_*gid

2017 02-15

197
推荐指数

3
解决办法

16万
查看次数

Java8:HashMap <X,Y>到HashMap <X,Z>使用Stream/Map-Reduce/Collector

我知道如何List从Y- > "转换"一个简单的Java Z,即:

List<String> x;
List<Integer> y = x.stream()
        .map(s -> Integer.parseInt(s))
        .collect(Collectors.toList());

Run Code Online (Sandbox Code Playgroud)

现在我想用Map做基本相同的事情,即:

INPUT:
{
  "key1" -> "41",    // "41" and "42"
  "key2" -> "42      // are Strings
}

OUTPUT:
{
  "key1" -> 41,      // 41 and 42
  "key2" -> 42       // are Integers
}

Run Code Online (Sandbox Code Playgroud)

解决方案不应限于String- > Integer.就像List上面的例子一样,我想调用任何方法(或构造函数).

java mapreduce java-8 java-stream collectors

Ben*_*n M

2015 01-07

188
推荐指数

6
解决办法

15万
查看次数

简单解释MapReduce？

与我的CouchDB问题有关.

任何人都可以用麻栗可以理解的方式解释MapReduce吗？

frameworks glossary mapreduce

ree*_*lex

2017 05-23

163
推荐指数

7
解决办法

7万
查看次数

在.NET中映射和减少

哪些情况可以保证使用" Map and Reduce "算法？

这个算法有.NET实现吗？

c# mapreduce

Dev*_*per

2009 01-10

130
推荐指数

3
解决办法

9万
查看次数

在Hadoop中链接多个MapReduce作业

在许多应用MapReduce的实际情况中,最终的算法最终会成为几个MapReduce步骤.

即Map1,Reduce1,Map2,Reduce2等.

因此,您可以获得下一个映射的输入所需的最后一个reduce的输出.

管道成功完成后,您(通常)不希望保留中间数据.另外,因为这个中间数据通常是一些数据结构(如'map'或'set'),所以你不想在编写和读取这些键值对时花费太多精力.

在Hadoop中推荐的方法是什么？

是否有(简单)示例显示如何以正确的方式处理此中间数据,包括之后的清理？

hadoop mapreduce

Nie*_*jes

2017 05-02

120
推荐指数

5
解决办法

8万
查看次数

Hadoop流程记录如何跨块边界分割？

根据 Hadoop - The Definitive Guide

FileInputFormats定义的逻辑记录通常不适合HDFS块.例如,TextInputFormat的逻辑记录是行,它们将经常跨越HDFS边界.这与你的程序的功能没有关系 - 例如,线路不会丢失或损坏 - 但值得了解,因为它确实意味着数据本地地图(即,与他们在同一主机上运行的地图)输入数据)将执行一些远程读取.这导致的轻微开销通常不显着.

假设记录行分为两个块(b1和b2).处理第一个块(b1)的映射器将注意到最后一行没有EOL分隔符,并从下一个数据块中取出剩余的行(b2).

映射器如何处理第二个块(b2)如何确定第一个记录是不完整的并且应该从块(b2)中的第二个记录开始处理？

hadoop split mapreduce block hdfs

Pra*_*ati

2015 09-04

118
推荐指数

3
解决办法

3万
查看次数