(按位)MySQL中的Supersets和Subsets

Mei*_*ner 4 mysql optimization bit-manipulation subset

以下查询在MySQL中是否有效:

SELECT * FROM table WHERE field & number = number; 
# to find values with superset of number's bits

SELECT * FROM table WHERE field | number = number; 
# to find values with subset of number's bits
Run Code Online (Sandbox Code Playgroud)

...如果已创建该字段的索引?

如果没有,有没有办法让它运行得更快?

Qua*_*noi 6

更新:

有关性能详情,请参阅我的博客中的此条目:


SELECT * FROM table WHERE field & number = number

SELECT * FROM table WHERE field | number = number
Run Code Online (Sandbox Code Playgroud)

该指数可以通过两种方式有效:

  1. 避免早期表扫描(因为要比较的值包含在索引本身中)
    • 限制检查值的范围.

上述查询中的任何条件都不是sargable,这是索引不会用于范围扫描(具有现在的条件).

但是,点1仍然存在,索引可能很有用.

如果您的表包含100平均每行字节数和1,000,000记录数,那么表扫描将需要扫描100 Mb数据.

如果您有索引(具有4字节键,6字节行指针和一些内部开销),则查询将需要仅扫描10 Mb数据以及过滤成功时表中的其他数据.

  • 如果您的条件没有选择性(您具有匹配条件的高概率),则表扫描更有效.
  • 如果您的条件具有选择性,则索引扫描效率更高(您的可能性低于匹配条件).

这两个查询都需要扫描整个索引.

但是通过重写AND查询,您也可以从索引的范围中受益.

这个条件:

field & number = number

如果number也设置了最高位集,则只能匹配字段field.

您应该为查询提供以下额外条件:

SELECT  *
FROM    table
WHERE   field & number = number
        AND field >= 0xFFFFFFFF & ~((2 << FLOOR(LOG(2, 0xFFFFFFFF & ~number))) - 1)
Run Code Online (Sandbox Code Playgroud)

这将使用粗滤波范围和精细滤波条件.

最后number未设置的位数越多越好.