hadoop是大数据空间中唯一的框架吗?

Kur*_*oZ7 13 hadoop bigdata

我目前正在学习hadoop,但我常常想知道Hadoop是否是支持分布式应用程序的唯一软件框架.我想了解在大数据空间中是否存在除Hadoop之外的任何其他框架.

Sag*_*kam 30

Hadoop替代品

Apache Spark - 开源集群计算系统,旨在快速实现数据分析 - 快速运行和快速写入.

GraphLab - 重新设计的完全分布式API,HDFS集成和各种新的机器学习工具包.

HPCC Systems - (高性能计算集群)是一个庞大的并行处理计算平台,可以解决大数据问题.

Dryad--正在研究用于编写并行和分布式程序的编程模型,以便从小型集群扩展到大型数据中心.

Apache Flink - 开源分布式数据处理平台.分布式程序表示为运算符的DAG(例如join,map,group,..)

Storm - 是一个免费的开源分布式实时计算系统.Storm可以轻松可靠地处理无限数据流,实时处理Hadoop为批处理所做的工作.风暴很简单,可以与任何编程语言一起使用,并且使用起来很有趣!

R3 - 是一个使用redis后端用python编写的map reduce引擎.

Disco - 是一种基于MapReduce范例的轻量级开源框架,用于分布式计算.

Phoenix - 是用于数据密集型处理任务的Google MapReduce模型的共享内存实现.

Plasma - PlasmaFS是用于大型文件的分布式文件系统,在用户空间中实现.Plasma Map/Reduce运行着名的算法方案,用于映射和重新排列大文件.Plasma KV是PlasmaFS之上的关键/值数据库

Peregrine - 是一个map reduce框架,用于跨数据分区运行迭代作业.

httpmr - 适用于具有Web群集的人员的可扩展数据处理框架.

扇区/领域 - 扇区是一种高性能,可扩展且安全的分布式文件系统.Sphere是一种高性能并行数据处理引擎,可以使用非常简单的编程接口处理存储节点上的扇区数据文件.

Filemap - 是一个轻量级系统,用于将Unix风格的文件处理工具应用于存储在文件中的大量数据.

misco - 是专为移动设备设计的分布式计算框架

MR-MPI - 是一个库,它是在标准MPI消息传递之上为分布式内存并行机器编写的MapReduce的开源实现

GridGain - 内存计算

全面的列表 - Hadoop以外的项目!