"HDFS缺少随机读写访问"是什么意思？

Question

"HDFS缺少随机读写访问"是什么意思？

lov*_*ing 18 hadoop hbase hdfs

任何文件系统都应提供API来访问其文件和目录等.

那么,"HDFS缺少随机读写访问"是什么意思？

所以,我们应该使用HBase.

Answer 1

Dan*_*bos 22

默认HDFS块大小为64 MB.所以你不能在这里读一行,一行.您总是读写64 MB块.当您想要处理整个文件时,这很好.但它使HDFS不适合某些应用程序,例如您希望使用索引来查找小记录.

另一方面,HBase非常适合这种情况.如果你想阅读一个小记录,你只会阅读那个小记录.

HBase使用HDFS作为其后备存储.那么它如何提供有效的基于记录的访问？

HBase将表从HDFS加载到内存或本地磁盘,因此大多数读取都不会转到HDFS.突变首先存储在仅附加日志中.当期刊变得庞大时,它被内置到"附录"表中.如果有太多的附录表,它们都会被压缩成一个全新的主表.对于读取,首先咨询期刊,然后是附录表,最后是主表.这个系统意味着当我们有一个完整的HDFS块的改变时,我们只写一个完整的HDFS块.

Bigtable白皮书中对此方法有更全面的描述.

归档时间：	11 年，11 月前
查看次数：	6907 次
最近记录：	6 年，9 月前