我刚开始探索Hive.它具有类似于表,连接,分区等RDBMS的所有结构.我所理解的是Hive仍然使用HDFS进行存储,它是HDFS的SQL抽象.由此我不确定天气Hive本身是一个像HBase,Cassnadra这样的数据库解决方案..或者只是它是HDFS之上的查询系统.我认为它不仅仅是一种查询语言,因为它具有表,连接和分区.
hadoop hbase hive
有人可以解释使用单词计数示例,为什么Spark会比Map Reduce更快?
mapreduce apache-spark
apache-spark ×1
hadoop ×1
hbase ×1
hive ×1
mapreduce ×1