我有一个HBase表,有100M +行和1百万+列.每行只有2到5列的数据.只有1个列系列.
我想找出所有不同的qualifiers(列)column family.有快速的方法吗?
qualifiers
column family
我可以考虑扫描整个表格,然后获取familyMap每一行,获取qualifier并添加到一个Set<>.但这将非常缓慢,因为有100M +行.
familyMap
qualifier
Set<>
我们可以做得更好吗?
hadoop hbase
hadoop ×1
hbase ×1