使用IN子查询改进MySQL查询

Jür*_*ock 4 mysql query-optimization explain

我有桌子items和桌子item_attributes.

为简单起见,假设我的表项有一列id和一列name.对于cource,id列上有一个索引.

item_attributes表具有的列id,item_id,attribute_nameattribute_value和索引ONattrubute_name

现在我想查询具有特定属性的所有项目而不使用连接.

我使用以下查询执行此操作:

SELECT *
FROM items i
WHERE i.id IN (
    SELECT item_id
    FROM item_attributes a
    WHERE a.attribute_name = 'SomeAttribute'
      AND a.attribute_value = 'SomeValue'
)
Run Code Online (Sandbox Code Playgroud)

SubQuery本身运行得很快.

如果我首先执行查询本身并将结果用于IN查询

SELECT *
FROM items i
WHERE i.id IN (1,3,5,7,10,...)
Run Code Online (Sandbox Code Playgroud)

它也很快.

但是,组合查询非常非常慢(> 2秒).如果我调查查询计划,我明白为什么:MySQL对items表执行全表扫描,而不是先执行子查询并使用结果进行索引查询.

1, 'PRIMARY', 'items', 'ALL', '', '', '', '', 149726, 'Using where'
2, 'DEPENDENT SUBQUERY', 'item_attributes', 'index_subquery', 'IDX_ATTRIBUTE_NAME', 'IDX_ATTRIBUTE_NAME', '4', 'func', 1, 'Using where'
Run Code Online (Sandbox Code Playgroud)

有没有办法优化此查询?我知道子查询将始终只返回一个小结果集(<100行).

Qua*_*noi 5

MySQL不能在IN子句中切换前导表和从动表.这将在以后得到纠正6.0.

现在,您可以像这样重写它(需要一个JOIN):

SELECT  i.*
FROM    (
        SELECT  DISTINCT item_id
        FROM    item_attributes a
        WHERE   a.attribute_name = 'SomeAttribute'
                AND a.attribute_value = 'SomeValue'
        ) ai
JOIN    items i
ON      i.id = ai.item_id
Run Code Online (Sandbox Code Playgroud)

由于您使用的是EAV模型,因此您可能希望创建一个唯一索引,(attribute_name, item_id)在这种情况下,您可以使用普通连接:

SELECT  i.*
FROM    item_attributes ai
JOIN    items i
ON      i.id = ai.item_id
WHERE   a.attribute_value = 'SomeValue'
        AND a.attribute_name = 'SomeAttribute'
Run Code Online (Sandbox Code Playgroud)