HBase区域服务器和Hadoop数据节点应该在同一台机器上吗?

gfy*_*ytd 9 hadoop hbase

对不起,我没有资源来设置集群来测试它,我只是想知道:

  1. 我可以在除hadoop数据节点机器之外的独立机器上部署hbase区域服务器吗?我想答案是肯定的,但我不确定.

  2. 在不同的机器上部署hbase区域服务器和hadoop数据节点是好还是坏?

  3. 将一些数据放入hbase时,这些数据最终存储在数据节点或区域服务器中?我猜它是数据节点,但是区域服务器中的StoreFile和HFile是不是存储数据的物理文件?

谢谢!

Rub*_*eda 7

  1. 如果您想要体面的性能,RegionServers应始终与分布式集群中的DataNode一起运行.

  2. 非常糟糕,这将违反数据位置原则(如果您想了解更多有关数据位置的信息,请查看此内容:http://www.larsgeorge.com/2010/05/hbase-file-locality-in-hdfs. HTML)

  3. 实际数据将存储在HDFS(DataNode)中,RegionServers负责服务和管理区域.

有关HBase架构的更多信息,请查看Lars博客上的这篇优秀文章:http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html

顺便说一句,只要你有一台具有不错RAM的PC,你就可以设置一个带有虚拟机的演示集群.如果没有在开发环境中首先正确测试平台,请不要尝试设置生产环境.