psm*_*ith 7 hbase hive hcatalog
enyone可以解释一下,HCatalog和HBase之间的关系是什么?
我发现了这些定义:
Apache HCatalog HCatalog是一个元数据抽象层,用于在不使用底层文件名或格式的情况下引用数据.它将用户和脚本与数据的物理存储方式和位置隔离开来.
Apache HBase HBase(Hadoop DataBase)是一个分布式,面向列的数据库.HBase将HDFS用于底层存储.它支持使用MapReduce和点查询(随机读取)的批处理样式计算.
我们在Hive中使用CREATE TABLE,它在HCatalog中创建表.我只是不明白.为什么不在真正的DATABASE中使用HBase?
HCatalog似乎是所有数据存储的某种metedata存储库.这是否意味着它还保存有关HBase中数据库和表的信息?
我将很感激解释
关心帕维尔
当您在HIVE中创建表时,它会在HCatalog中注册它.Hive中的表可以是HBase表,但它也可以是HDFS文件和目录之上的抽象
您可以在HortonWorks网站上找到HCatalog的一个很好的解释