Postgres中的按位操作

jer*_*use 6 postgresql indexing performance bit-manipulation

我有以下表格:

types | id | name
------+----+----------
         1 | A
         2 | B
         4 | C
         8 | D
         16| E
         32| F
Run Code Online (Sandbox Code Playgroud)

vendors | id | name     | type
--------+----+----------+-----
           1 | Alex     | 2     //type B only
           2 | Bob      | 5     //A,C
           3 | Cheryl   | 32    //F
           4 | David    | 43    //F,D,A,B
           5 | Ed       | 15    //A,B,C,D
           6 | Felix    | 8     //D
           7 | Gopal    | 4     //C
           8 | Herry    | 9     //A,D
           9 | Iris     | 7     //A,B,C
           10| Jack     | 23    //A,B,C,E
Run Code Online (Sandbox Code Playgroud)

我想现在查询:

select id, name from vendors where type & 16 >0 //should return Jack as he is type E
select id, name from vendors where type & 7 >0 //should return Ed, Iris, Jack
select id, name from vendors where type & 8 >0 //should return David, Ed, Felix, Herry 
Run Code Online (Sandbox Code Playgroud)

typesvendorspostgres 的最佳索引是什么?我可能在供应商中有数百万行.此外,与使用第3表的多对多关系相比,使用这种按位方法的权衡是什么?哪个更好?

ara*_*nid 9

使用可以使用部分索引来解决"&"不是可索引运算符(afaik)的事实:

CREATE INDEX vendors_typeA ON vendors(id) WHERE (type & 2) > 0;
CREATE INDEX vendors_typeB ON vendors(id) WHERE (type & 4) > 0;
Run Code Online (Sandbox Code Playgroud)

当然,每次添加新类型时都需要添加新索引.这是将数据扩展到关联表中的原因之一,然后可以对其进行正确索引.您总是可以编写触发器来另外维护一个位掩码表,但是使用多对多表来实际维护数据,因为它会更加清晰.

如果您对扩展和性能的整体评估是说"我可能有数百万行",那么您还没有做足够的事情来开始进行这种优化.首先创建一个结构合理的清晰模型,然后根据其执行情况的实际统计数据对其进行优化.