什么是蜂巢,它是一个数据库吗?

Bra*_*ild 28 hadoop hbase hive

我刚开始探索Hive.它具有类似于表,连接,分区等RDBMS的所有结构.我所理解的是Hive仍然使用HDFS进行存储,它是HDFS的SQL抽象.由此我不确定天气Hive本身是一个像HBase,Cassnadra这样的数据库解决方案..或者只是它是HDFS之上的查询系统.我认为它不仅仅是一种查询语言,因为它具有表,连接和分区.

San*_*ngh 44

Hive是一个构建在Hadoop之上的数据仓库包/基础架构.它提供了一种SQL方言,称为Hive查询语言(HQL),用于查询存储在Hadoop集群中的数据.HQL是Hive查询语言.与所有广泛使用的SQL方言一样,它并不完全符合ANSI SQL标准的任何特定修订版.它可能最接近MySQL的方言,但有很大的差异.Hive不支持行级插入,更新和删除.Hive不支持事务.因此我们无法将其与RDBMS进行比较.Hive添加扩展以在Hadoop环境中提供更好的性能,并与自定义扩展甚至外部程序集成.它非常适合批处理数据,如:日志处理,文本挖掘,文档索引,面向客户的商业智能,预测建模,假设检验等.

Hive不是为在线交易处理而设计的,不提供实时查询.

  • 请注意[HIVE-5317 - 在具有完整ACID支持的Hive中实现插入,更新和删除](https://issues.apache.org/jira/browse/HIVE-5317)正在积极开展工作,请参阅[添加ACID到Apache Hive](http://hortonworks.com/blog/adding-acid-to-apache-hive/) (6认同)
  • 此功能此后使其蜂巢。 (2认同)