Ros*_*iya 3 hadoop apache-spark
随着市场火花越来越大,我现在可以看到Spark的主要用例如Hadoop:
我的问题是:
如今的 Hadoop 是一系列技术的集合,但其本质是分布式文件系统 (HDFS) 和分布式资源管理器 (YARN)。Spark 是一个分布式计算框架,有望取代 Map/Reduce——另一种分布式计算框架
具体来说 - Spark 不会取代 Hadoop,但可能会取代 Map/Reduce 和 Hadoop,Map/Reduce 和 Spark 都是分布式系统(并且并行运行)
小智 5
Spark在某种意义上与hadoop不同,它允许您在一个工具中集成数据提取,处理和实时分析.此外,火花图减少框架不同于标准的hadoop map减少因为在火花中间图减少结果被缓存,并且如果需要重用相同的结果,RDD(对于故障容忍的分布式集合的abstarction)可以保存在存储器中(迭代的alghoritms,group by等等).
我的回答非常肤浅,并没有完全回答你的问题,只是指出一些主要的区别(实际上更多)Spark和数据库官方网站真的有很好的文档记录,你的问题已在那里得到解答:
https://databricks.com/spark/about
http://spark.apache.org/faq.html
| 归档时间: |
|
| 查看次数: |
2255 次 |
| 最近记录: |