Adr*_*ean 3 hbase nosql hbasestorage
我想使用匹配某种模式的行从 HBase shell 扫描 HTable 中的行。
例如,我有以下表格数据:
row:r1_t1 column:cf:a, timestamp=1461911995948,value=v1
row:r2_t2 column:cf:a, timestamp=1461911995949,value=v2
row:s1_t1 column:cf:a, timestamp=1461911995950,value=q1
row:s2_t2 column:cf:a, timestamp=1461911995951,value=q2
Run Code Online (Sandbox Code Playgroud)
根据上述数据,我想找到包含 't1' 的行:
row:r1_t1 column:cf:a, timestamp=1461911995948,value=v1
row:s1_t1 column:cf:a, timestamp=1461911995950,value=q1
Run Code Online (Sandbox Code Playgroud)
我知道我可以使用 PrefixFilter 扫描表,但此方法采用以指定过滤器开头的行。
scan 'test', {FILTER => "(PrefixFilter('s')"}
Run Code Online (Sandbox Code Playgroud)
是否有类似的基于过滤行名称中间模式匹配的行来扫描表的方法?
hbase(main):003:0> scan 'test', {ENDROW => 't1'}
Run Code Online (Sandbox Code Playgroud)
通常,使用 aPrefixFilter可能会很慢,因为它会执行表扫描,直到到达前缀为止。
也可以将 RowFilter 与 SubstringComparator 一起使用,如下所示
可以使用RowFilter与SubstringComparator像下面
hbase(main):003:0> import org.apache.hadoop.hbase.filter.CompareFilter
hbase(main):005:0> import org.apache.hadoop.hbase.filter.SubstringComparator
hbase(main):006:0> scan 'test', {FILTER => org.apache.hadoop.hbase.filter.RowFilter.new(CompareFilter::CompareOp.valueOf('EQUAL'),SubstringComparator.new("searchkeyword"))}
Run Code Online (Sandbox Code Playgroud)