你能索引子查询吗?

phy*_*ion 11 mysql indexing subquery

我有一个表和一个如下所示的查询.有关工作示例,请参阅此SQL小提琴.

SELECT o.property_B, SUM(o.score1), w.score
FROM o
INNER JOIN 
(
    SELECT o.property_B, SUM(o.score2) AS score FROM o GROUP BY property_B
) w ON w.property_B = o.property_B
WHERE o.property_A = 'specific_A'
GROUP BY property_B;
Run Code Online (Sandbox Code Playgroud)

使用我的真实数据,此查询需要27秒.但是,如果我首先创建w作为临时表和索引property_B,它们总共需要约1秒.

CREATE TEMPORARY TABLE w AS
SELECT o.property_B, SUM(o.score2) AS score FROM o GROUP BY property_B;

ALTER TABLE w ADD INDEX `property_B_idx` (property_B);

SELECT o.property_B, SUM(o.score1), w.score
FROM o
INNER JOIN w ON w.property_B = o.property_B
WHERE o.property_A = 'specific_A'
GROUP BY property_B;

DROP TABLE IF EXISTS w;
Run Code Online (Sandbox Code Playgroud)

有没有办法结合这两个查询中最好的?即单个查询与子查询中索引的速度优势?

编辑

在下面的Mehran回答之后,我在MySQL文档中阅读了这条解释:

从MySQL 5.6.3开始,优化器可以更有效地处理FROM子句中的子查询(即派生表):

...

对于FROM子句中子查询需要实现的情况,优化器可以通过向实现表添加索引来加快对结果的访问.如果这样的索引允许对表进行ref访问,则可以大大减少在查询执行期间必须读取的数据量.请考虑以下查询:

SELECT * FROM t1
  JOIN (SELECT * FROM t2) AS derived_t2 ON t1.f1=derived_t2.f1;
Run Code Online (Sandbox Code Playgroud)

优化程序在derived_t2的列f1上构造索引,如果这样做,则允许对最低成本的执行计划使用ref访问.添加索引后,优化程序可以将具体化派生表视为与具有索引的常规表相同,并且它与生成的索引类似.与没有索引的查询执行成本相比,索引创建的开销可以忽略不计.如果ref访问会导致比其他访问方法更高的成本,则不会创建任何索引,并且优化程序也不会丢失任何内容.

Meh*_*ran 5

首先你要知道创建临时表绝对是一个可行的方案。但在没有其他选择适用的情况下,这里不是真的!

在您的情况下,您可以像FrankPl指出的那样轻松提升查询,因为您的子查询和主查询都按同一字段分组。所以你不需要任何子查询。为了完整起见,我将复制并粘贴 FrankPl 的解决方案:

SELECT o.property_B, SUM(o.score1), SUM(o.score2)
FROM o
GROUP BY property_B;
Run Code Online (Sandbox Code Playgroud)

然而,这并不意味着不可能遇到您希望可以索引子查询的场景。在这种情况下,您有两个选择,第一个是使用您自己指出的临时表,保存子查询的结果。这个解决方案是有利的,因为它被 MySQL 支持了很长时间。如果涉及大量数据,这是不可行的。

第二种解决方案是使用MySQL 5.6 或更高版本。在最新版本的 MySQL 中,新算法被合并,因此在子查询中使用的表上定义的索引也可以在子查询之外使用。

[更新]

对于问题的编辑版本,我会推荐以下解决方案:

SELECT o.property_B, SUM(IF(o.property_A = 'specific_A', o.score1, 0)), SUM(o.score2)
FROM o
GROUP BY property_B
HAVING SUM(IF(o.property_A = 'specific_A', o.score1, 0)) > 0;
Run Code Online (Sandbox Code Playgroud)

但是你需要在这HAVING部分工作。您可能需要根据您的实际问题更改它。