嗨,我是hbase和hadoop的新手.我找不到为什么我们使用hadoop和hbase.我知道hadoop是一个文件系统,但我读到我们可以使用没有hadoop的hbase,为什么我们使用hadoop?
谢谢
Tar*_*riq 11
Hadoop是一个平台,允许我们以并行方式跨机器集群存储和处理大量数据.这是一个批处理系统,我们不必担心数据存储或处理的内部.它不是只提供HDFS,用于可靠数据存储的分布式文件系统,以及一个处理框架MapReduce,它允许以并行方式跨机器集群处理大量数据集.Hadoop的一大优势是它提供了数据局部性.我的意思是移动数据做得很大是昂贵的.所以Hadoop将计算移动到数据.Hdfs和MapReduce都经过高度优化,可以处理真正大的数据.Hdfs通过数据复制确保高可用性和故障转移,如果有的话由于一些灾难导致群集中的计算机停机,您的数据仍然安全可用.另一方面,Hbase是一个NoSQL数据库.我们可以把它看作一个分布式,可扩展的大数据存储.它用于克服Hdfs的陷阱,如"无法随机读写".如果我们需要对数据进行随机,实时的读/写访问,Hbase是一个合适的选择.它是以Google的"BigTable"为模型,而Hdfs是在GFS(Google文件系统)之后建模的.没有必要在顶层使用Hbase仅限Hdfs.我们可以将Hbase与其他持久存储一起使用,如"S3"或"EBS".如果您想了解deatil中的Hadoop和Hbase,可以访问相应的主页 - "hadoop.apache.org"和"hbase" .apache.org".如果你想深入学习"Hadoop.The.Definitive.Guide"和"HBase.The.Definitive.Guide",你也可以阅读以下书籍.