Spe*_*cer 614 mysql sql join outer-join full-outer-join
我想在MySQL中进行全外连接.这可能吗?MySQL是否支持Full Outer Join?
Pab*_*ruz 618
您没有在MySQL上完全加入,但您可以确保模仿它们.
对于从此SO问题转录的代码SAMPLE,您有:
有两个表t1,t2:
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
Run Code Online (Sandbox Code Playgroud)
上面的查询适用于FULL OUTER JOIN操作不会产生任何重复行的特殊情况.上面的查询依赖于UNIONset运算符来删除查询模式引入的重复行.我们可以通过对第二个查询使用反连接模式来避免引入重复行,然后使用UNION ALL集合运算符来组合这两个集合.在更一般的情况下,FULL OUTER JOIN将返回重复的行,我们可以这样做:
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION ALL
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
WHERE t1.id IS NULL
Run Code Online (Sandbox Code Playgroud)
Nat*_*ong 339
Pablo Santa Cruz给出的答案是正确的; 但是,如果有人偶然发现了这个页面并想要进一步澄清,这里有一个详细的细分.
假设我们有以下表格:
-- t1
id name
1 Tim
2 Marta
-- t2
id name
1 Tim
3 Katarina
Run Code Online (Sandbox Code Playgroud)
内连接,如下所示:
SELECT *
FROM `t1`
INNER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
Run Code Online (Sandbox Code Playgroud)
只会让我们看到两个表中出现的记录,如下所示:
1 Tim 1 Tim
Run Code Online (Sandbox Code Playgroud)
内连接没有方向(如左或右),因为它们是明确双向的 - 我们需要在两侧都匹配.
另一方面,外连接用于查找在另一个表中可能没有匹配的记录.因此,您必须指定允许连接的哪一侧具有缺失记录.
LEFT JOIN和RIGHT JOIN是简写LEFT OUTER JOIN和RIGHT OUTER JOIN; 我将使用下面的全名来强化外连接与内连接的概念.
左外连接,如下所示:
SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
Run Code Online (Sandbox Code Playgroud)
...将从左表中获取所有记录,无论它们是否在右表中匹配,如下所示:
1 Tim 1 Tim
2 Marta NULL NULL
Run Code Online (Sandbox Code Playgroud)
右外连接,如下所示:
SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
Run Code Online (Sandbox Code Playgroud)
...将从右表中获取所有记录,无论左表中是否有匹配,如下所示:
1 Tim 1 Tim
NULL NULL 3 Katarina
Run Code Online (Sandbox Code Playgroud)
完全外连接将为我们提供来自两个表的所有记录,无论它们是否在另一个表中具有匹配,在没有匹配的情况下两侧都有NULL.结果如下所示:
1 Tim 1 Tim
2 Marta NULL NULL
NULL NULL 3 Katarina
Run Code Online (Sandbox Code Playgroud)
然而,正如Pablo Santa Cruz指出的那样,MySQL并不支持这一点.我们可以通过执行左连接和右连接的UNION来模拟它,如下所示:
SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`
UNION
SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
Run Code Online (Sandbox Code Playgroud)
您可以将a UNION视为"运行这两个查询,然后将结果堆叠在一起"; 一些行将来自第一个查询,一些来自第二个查询.
应该注意的是UNION,MySQL 中的a 将消除完全相同的重复:Tim将出现在这两个查询中,但结果UNION只列出了他一次.我的数据库大师同事觉得不应该依赖这种行为.所以为了更加明确,我们可以WHERE在第二个查询中添加一个子句:
SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`
UNION
SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`
WHERE `t1`.`id` IS NULL;
Run Code Online (Sandbox Code Playgroud)
另一方面,如果您因某些原因想要查看重复项,可以使用UNION ALL.
shA*_*A.t 33
使用union查询将删除重复项,这与full outer join从不删除任何重复项的行为不同:
[Table: t1] [Table: t2]
value value
------- -------
1 1
2 2
4 2
4 5
Run Code Online (Sandbox Code Playgroud)
这是预期的结果full outer join:
value | value
------+-------
1 | 1
2 | 2
2 | 2
Null | 5
4 | Null
4 | Null
Run Code Online (Sandbox Code Playgroud)
这是使用left和right Join使用的结果union:
value | value
------+-------
Null | 5
1 | 1
2 | 2
4 | Null
Run Code Online (Sandbox Code Playgroud)
我建议的查询是:
select
t1.value, t2.value
from t1
left outer join t2
on t1.value = t2.value
union all -- Using `union all` instead of `union`
select
t1.value, t2.value
from t2
left outer join t1
on t1.value = t2.value
where
t1.value IS NULL
Run Code Online (Sandbox Code Playgroud)
上述查询的结果与预期结果相同:
value | value
------+-------
1 | 1
2 | 2
2 | 2
4 | NULL
4 | NULL
NULL | 5
Run Code Online (Sandbox Code Playgroud)
@Steve Chambers:[来自评论,非常感谢!]
注意:这可能是最佳解决方案,无论是效率还是生成相同的结果FULL OUTER JOIN.这篇博文也很好地解释了 - 引用方法2:"这正确地处理重复的行,并且不包括它不应该包含的任何内容.必须使用UNION ALL而不是plainUNION,这将消除我想要保留的重复项.在大型结果集上可能会显着提高效率,因为不需要对重复项进行排序和删除."
我决定添加另一个来自full outer join可视化和数学的解决方案,它不是更好,但更可读:
全外连接方式
(t1 ? t2):全部t1或t2
(t1 ? t2) = (t1 ? t2) + t1_only + t2_only全部都:t1和t2加上所有的t1在没有t2和以及所有在t2不在t1:
-- (t1 ? t2): all in both t1 and t2
select t1.value, t2.value
from t1 join t2 on t1.value = t2.value
union all -- And plus
-- all in t1 that not exists in t2
select t1.value, null
from t1
where not exists( select 1 from t2 where t2.value = t1.value)
union all -- and plus
-- all in t2 that not exists in t1
select null, t2.value
from t2
where not exists( select 1 from t1 where t2.value = t1.value)
Run Code Online (Sandbox Code Playgroud)
Gor*_*off 13
前面的答案实际上都不正确,因为当存在重复值时它们不遵循语义。
对于诸如(来自此重复项)的查询:
SELECT * FROM t1 FULL OUTER JOIN t2 ON t1.Name = t2.Name;
Run Code Online (Sandbox Code Playgroud)
正确的等价是:
SELECT t1.*, t2.*
FROM (SELECT name FROM t1 UNION -- This is intentionally UNION to remove duplicates
SELECT name FROM t2
) n LEFT JOIN
t1
ON t1.name = n.name LEFT JOIN
t2
ON t2.name = n.name;
Run Code Online (Sandbox Code Playgroud)
如果您需要它来处理NULL值(这可能也是必要的),请使用NULL-safe 比较运算符,<=>而不是=。
为了更加清晰,我修改了shA.t 的查询:
-- t1 left join t2
SELECT t1.value, t2.value
FROM t1 LEFT JOIN t2 ON t1.value = t2.value
UNION ALL -- include duplicates
-- t1 right exclude join t2 (records found only in t2)
SELECT t1.value, t2.value
FROM t1 RIGHT JOIN t2 ON t1.value = t2.value
WHERE t1.value IS NULL
Run Code Online (Sandbox Code Playgroud)
MySql没有FULL-OUTER-JOIN语法。您必须通过执行LEFT JOIN和RIGHT JOIN来模拟,如下所示:
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
Run Code Online (Sandbox Code Playgroud)
但是MySql也没有RIGHT JOIN语法。根据MySql的外部联接简化,通过在查询的FROMand ON子句中切换t1和t2,将右联接转换为等效的左联接。因此,MySql Query Optimizer会将原始查询转换为以下内容-
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id
Run Code Online (Sandbox Code Playgroud)
现在,按原样编写原始查询没有什么害处,但是如果您有诸如WHERE子句之类的谓词(这是联接前的谓词),或者该ON子句中的AND谓词(这是联接期间的谓词),那么您可能想看看魔鬼;这是详细信息。
MySql查询优化器会定期检查谓词是否被null拒绝。
现在,如果您已完成RIGHT JOIN,但在t1列上使用WHERE谓词,则可能有陷入空值拒绝情况的风险。
例如,以下查询-
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
Run Code Online (Sandbox Code Playgroud)
由Query Optimizer转换为以下内容-
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id
WHERE t1.col1 = 'someValue'
Run Code Online (Sandbox Code Playgroud)
因此,表的顺序已更改,但谓词仍适用于t1,但是t1现在位于“ ON”子句中。如果将t1.col1定义为NOT NULL
column,则此查询将为null拒绝。
MySql将任何被null拒绝的外部联接(左,右,完整)转换为内部联接。
因此,您可能期望的结果可能与MySql返回的结果完全不同。您可能认为它与MySql的RIGHT JOIN有关,但那是不对的。这就是MySql查询优化器的工作方式。因此,负责开发人员在构建查询时必须注意这些细微差别。