维基百科对Map Reduce的解释减少了吗？

z5h*_*z5h 5 mapreduce mongodb

MongoDB对减少阶段的解释说:

map/reduce引擎可以迭代地调用reduce函数; 因此,这些功能必须是幂等的.

这就是我总是理解减少在一般地图缩减环境中工作的方式.在这里,您可以通过减少每台机器上的值,然后将这些输出发送到另一台减速机来对N台机器的值求和.

维基百科说:

框架为排序顺序中的每个唯一键调用应用程序的Reduce函数一次.Reduce可以迭代与该键关联的值并生成零个或多个输出.

在这里,您需要将所有值(使用相同的键)移动到要求求的同一台机器上.将数据移动到函数似乎与map reduce应该做的相反.

维基百科的描述是否过于具体？或者MongoDB是否打破了map-reduce？(或者我在这里错过了一些？)

Google是这样描述原始 MapReduce 框架的：

\n

\n
2 编程模型
\n
[...]
\n
中间值通过迭代器提供给 user\xe2\x80\x99s 的归约函数。这使我们能够处理太大而无法容纳在内存中的值列表。
\n

\n

然后：

\n

\n
3 实施
\n
[...]
\n
6.Reduce Worker 迭代排序后的中间数据，对于遇到的每个唯一中间键，它将键和相应的中间值集传递给 user\xe2\x80\x99s Reduce 函数。
\n

\n

所以只有一次调用Reduce。通过使用特殊的组合器解决了移动大量小型中间对的问题：

\n
\n
4.3 合路器功能
\n
在某些情况下，每个映射任务生成的中间键存在大量重复[...]我们允许用户指定一个可选Combiner函数，该函数在通过网络发送数据之前对该数据进行部分合并。
\n
该Combiner函数在每台执行map任务的机器上执行。通常，相同的代码用于实现组合器和化简函数。[...]
\n
部分组合显着加速了某些类别的 MapReduce 操作。
\n
\n
长话短说
\n
维基百科遵循原始的 MapReduce 设计，MongoDB 设计者采取了略有不同的方法。
\n

归档时间：

13 年，4 月前

查看次数：

438 次

最近记录：

12 年，6 月前

相关归档

Mongo $ group with $ project 24

在MongoDB文档中搜索带有特殊字符的字符串 18

如何在 Robo 3T（原 Robomongo）中创建 Mongodb 索引？ 11

在Spring包含数组的Spring中进行mongo查询 8

MongoDB：未知运算符：$or 8

是否有办法自动使MongoDB C#Driver在主服务器出现故障时不抛出EndOfStreamException？ 7

返回 MongoDB 中数组项的子集 6

Prisma + MongoDB -> 副本集 6

将我的 Node.js 应用程序上线 5

如何将MongoDB驱动程序与C＃ASP.NET Core API框架一起使用？ 5

难疑归档

如何从JavaScript中删除数组中的特定元素？ 7655

HTML中id属性的有效值是什么？ 1945

如何在Linux中对文件进行符号链接？ 1865

对于数组,为什么a [5] == 5 [a]？ 1567

显示屏上的转换:属性 1322

为什么我们需要C++中的虚函数？ 1223

如何从JavaScript对象中删除密钥？ 1171

为特定提交生成git补丁 1144

Django会扩展吗？ 1101

如何在JavaScript中创建二维数组？ 1081

Copyright Info

© Copyright 2013-2021 admin@qa.1r1g.com

如未特别说明，本网站的内容使用如下协议:
Creative Commons Atution-NonCommercial-ShareAlike 4.0 International license.

用以下方式浏览

大分类

日期

标签

参考资料

qa.1r1g.com

superuser

askubuntu

unix

dba

serverfault

www website

回到顶部

网安备44200002443738

粤ICP备19038133号