机器学习算法无法应用地图缩减模型

use*_*342 6 mapreduce machine-learning

文章"Map-Reduce for Machine Learning on Multicore"显示了10种机器学习算法,它们可以从map reduce模型中受益.关键点是"任何拟合统计查询模型的算法都可以用一定的"求和形式编写.",算法可以表示为求和形式,可以应用地图缩减编程模型.

对于那些无法表示为求和形式的算法,并不意味着它们不能应用地图缩减模型.任何人都可以指出任何特定的机器学习算法,它不能通过map reduce模型加速吗?

gre*_*ess 3

当数据中存在计算依赖性时,MapReduce 不起作用。这种限制使得很难表示在结构化模型上运行的算法。

因此,当面对大规模问题时,我们经常放弃丰富的结构化模型,转而采用适合 MapReduce 抽象的过于简单的方法2

在机器学习领域,许多算法在学习和推理过程中迭代地变换参数,例如置信传播、期望最大化、梯度下降和吉布斯采样。这些算法迭代地细化一组参数,直到匹配某些终止标准2

如果您在每次迭代中调用 MapReduce,是的,我认为您仍然可以加快计算速度。这里的要点是,我们需要一个更好的抽象框架,以便能够拥抱数据的图形结构,表达复杂的调度或自动评估终止。

顺便说一句,Graphlab是出于上述原因2的替代方案之一。