什么是"Hadoop" - Hadoop的定义?

neu*_*use 10 hadoop hbase hdfs hadoop-yarn apache-spark

这是一种明显的,我们都会同意,我们可以称之为HDFS + YARN + MapReduceHadoop的.但是,Hadoop生态系统中不同的其他组合和其他产品会发生什么?

例如,HDFS + YARN + Spark仍然是Hadoop?是HBASE Hadoop吗?我想我们考虑HDFS + YARN + Pig Hadoop,因为Pig使用MapReduce.

只有MapReduce工具被认为是Hadoop,但其他任何运行的东西HDFS + YARN(如Spark)都是非Hadoop吗?

Dan*_*bos 6

我同意你的印象,即"Hadoop"这个术语没有一个有用的定义."我们有一个Hadoop集群"可能意味着各种各样的事情.

http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F上有一个官方答案:

Apache™Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件.

Apache Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集.

所以"Hadoop"是项目和软件库的名称.任何其他用法都是不明确的.