neu*_*use 10 hadoop hbase hdfs hadoop-yarn apache-spark
这是一种明显的,我们都会同意,我们可以称之为HDFS + YARN + MapReduce是Hadoop的.但是,Hadoop生态系统中不同的其他组合和其他产品会发生什么?
例如,HDFS + YARN + Spark仍然是Hadoop?是HBASE Hadoop吗?我想我们考虑HDFS + YARN + Pig Hadoop,因为Pig使用MapReduce.
只有MapReduce工具被认为是Hadoop,但其他任何运行的东西HDFS + YARN(如Spark)都是非Hadoop吗?
我同意你的印象,即"Hadoop"这个术语没有一个有用的定义."我们有一个Hadoop集群"可能意味着各种各样的事情.
在http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F上有一个官方答案:
Apache™Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件.
Apache Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集.
所以"Hadoop"是项目和软件库的名称.任何其他用法都是不明确的.