相关疑难解决方法(0)

MapReduce还是Spark?

我用cloudera测试了hadoop和mapreduce,我发现它非常酷,我认为我是最新的相关BigData解决方案.但是几天前,我发现了这个:https: //spark.incubator.apache.org/

一个"闪电快速集群计算系统",能够在Hadoop集群的顶部工作,并且显然能够破坏mapreduce.我看到它在RAM中比mapreduce更有效.我认为当你必须进行集群计算来克服单个机器上的I/O问题时,mapreduce仍然是相关的.但是,由于Spark可以完成mapreduce所做的工作,并且可能在几个操作上更有效率,它不是MapReduce的结束吗?或者MapReduce可以做些什么,或者MapReduce在特定环境中比Spark更有效?

hadoop mapreduce bigdata apache-spark

26
推荐指数
2
解决办法
2万
查看次数

为什么Spark比Hadoop Map Reduce更快

有人可以解释使用单词计数示例,为什么Spark会比Map Reduce更快?

mapreduce apache-spark

14
推荐指数
2
解决办法
6477
查看次数

Apache Spark 与 Hadoop 方法有何不同?

每个人都说 Spark 正在使用内存,因此它比 Hadoop 快得多。

我从 Spark 文档中不明白真正的区别是什么。

  • Spark 将数据存储在内存中的什么位置,而 Hadoop 则不存储?
  • 如果数据对于内存来说太大会发生什么?在这种情况下,它与 Hadoop 有多相似?

hadoop apache-spark

5
推荐指数
2
解决办法
988
查看次数

标签 统计

apache-spark ×3

hadoop ×2

mapreduce ×2

bigdata ×1