Hadoop和HBase

9 hadoop hbase

嗨,我是hbase和hadoop的新手.我找不到为什么我们使用hadoop和hbase.我知道hadoop是一个文件系统,但我读到我们可以使用没有hadoop的hbase,为什么我们使用hadoop?
谢谢

Tar*_*riq 11

Hadoop是一个平台,允许我们以并行方式跨机器集群存储和处理大量数据.这是一个批处理系统,我们不必担心数据存储或处理的内部.它不是只提供HDFS,用于可靠数据存储的分布式文件系统,以及一个处理框架MapReduce,它允许以并行方式跨机器集群处理大量数据集.Hadoop的一大优势是它提供了数据局部性.我的意思是移动数据做得很大是昂贵的.所以Hadoop将计算移动到数据.Hdfs和MapReduce都经过高度优化,可以处理真正大的数据.Hdfs通过数据复制确保高可用性和故障转移,如果有的话由于一些灾难导致群集中的计算机停机,您的数据仍然安全可用.另一方面,Hbase是一个NoSQL数据库.我们可以把它看作一个分布式,可扩展的大数据存储.它用于克服Hdfs的陷阱,如"无法随机读写".如果我们需要对数据进行随机,实时的读/写访问,Hbase是一个合适的选择.它是以Google的"BigTable"为模型,而Hdfs是在GFS(Google文件系统)之后建模的.没有必要在顶层使用Hbase仅限Hdfs.我们可以将Hbase与其他持久存储一起使用,如"S3"或"EBS".如果您想了解deatil中的Hadoop和Hbase,可以访问相应的主页 - "hadoop.apache.org"和"hbase" .apache.org".如果你想深入学习"Hadoop.The.Definitive.Guide"和"HBase.The.Definitive.Guide",你也可以阅读以下书籍.


kha*_*han 10

名为HDFS的Hadoop分布式文件系统为我们提供了多个作业.实际上我们不能说Hadoop只是一个文件系统,但它也为我们提供了资源,因此我们可以通过为我们提供一个主从架构来执行分布式处理,从而可以轻松地管理我们的数据.

至于HBase的问题,让我告诉你,如果不使用HDFS就无法远程连接到HBase,因为HBase无法创建集群,并且它有自己的本地文件系统.

我想你应该看到这个链接为
hadoop的好介绍!