加入与子查询

Question

我是一个老派的MySQL用户,并且总是优先JOIN于子查询.但是现在每个人都使用子查询,我讨厌它; 我不知道为什么.

如果存在任何差异,我缺乏理论知识来判断自己.子查询是否与a一样好JOIN,因此没有什么可担心的？

Answer 1

子查询是解决形式问题的逻辑上正确的方法,"从A获取事实,以B中的事实为条件".在这种情况下,在子查询中粘贴B比进行连接更合乎逻辑.从实际意义上讲,它也更安全,因为你不必因为多次匹配B而从A中获取重复的事实时要谨慎.

然而,实际上,答案通常归结为性能.一些优化器在给出连接和子查询时会吮吸柠檬,而另一些优化者则以另一种方式吮吸柠檬,这是特定于优化器,特定于DBMS的版本和查询特定的.

从历史上看,显式连接通常会获胜,因此连接的既定智慧更好,但优化器一直在变得越来越好,所以我更喜欢先以逻辑连贯的方式编写查询,然后在性能限制要求时进行重组.

很好的答案.我还要补充一点,开发人员(尤其是业余开发人员)并不总是精通SQL. (98认同)
+1，以便在快速之前将其正确设置。 (69认同)
@JinghuiNiu购买贵物品的顾客:`选择custid从cust join使用(custid)购买,价格> 500`.如果顾客购买了多件昂贵的物品,你会得到双倍的打击.为了解决这个问题,`从存在的select select custid(select*from buy where custid = cust.custid and price> 500)`.您可以使用`select distinct ...'来代替,但对于优化程序或评估程序来说,它通常更有用. (6认同)
+1很长一段时间寻找这个问题的一些合理解释,这只是对我而言合乎逻辑的答案 (4认同)
@Marcelo Cantos，您能否举一个您的陈述的例子“从实际意义上讲，它也更安全，因为您不必因为与 B 的多次比赛而从 A 获得重复的事实”？我发现这非常有见地，但有点太抽象了。谢谢。 (4认同)

Answer 2

在大多数情况下,JOINs比子查询更快,并且子查询的速度非常快.

在JOINRDBMS中可以创建一个更适合您的查询的执行计划,并且可以预测应该加载哪些数据以进行处理并节省时间,这与子查询不同,子查询将运行所有查询并加载所有数据以进行处理.

子查询的好处是它们比JOINs 更具可读性:这就是大多数新SQL用户更喜欢它们的原因; 这是简单的方法; 但是在性能方面,JOINS在大多数情况下都更好,即使它们也不难读.

我对包含对上层查询的反向引用的子查询有很好的体验,特别是当涉及到超过100,000的行数时.事情似乎是内存使用和交换文件的分页.连接会产生大量数据,这些数据可能不适合内存,必须分页到交换文件中.只要是这种情况,小的子选择的查询时间,例如`select*from a where ax =(select bx form b where b.id = a.id)`与连接相比非常小.这是一个非常具体的问题,但在某些情况下,它会带您从几小时到几分钟. (61认同)
你能用文件参考或测试结果证明你的任何要点吗？ (21认同)
对于提出的问题,这个答案有点过于简单.正如您所述:某些子查询是正常的,而某些子查询则没有.答案并没有真正帮助区分这两者.(也是'非常罕见'真的取决于你的数据/应用程序). (16认同)
是的,因此大多数数据库都将其作为优化步骤,在分析查询时将子查询转换为连接. (14认同)
我对Oracle很有经验,我可以说,如果您没有对它们进行任何过滤或排序,则子查询在大型表上要好得多. (12认同)

Answer 3

LEFT [OUTER] JOIN可以比等效的子查询更快,因为服务器可能能够更好地优化它 - 这一事实并非仅针对MySQL Server.

因此子查询可能比LEFT [OUTER] JOINS慢,但在我看来,它们的强度可读性稍高.

性能比可读性更重要. (69认同)
@ user1735921它取决于IMO ......一般来说,代码的可读性非常重要,因为它对以后的管理非常重要......让我们记住Donald Knuth的着名陈述:*"过早优化是其根源编程中的所有邪恶(或至少大部分)"*.然而,自然有一些编程领域,性能是至关重要的...理想情况下,当一个成功地协调一个与另一个:) (42认同)
在更复杂的查询中,我发现连接比子查询更容易阅读.子查询变成了我脑袋里的一碗面条. (27认同)
@ user1735921当然,特别是当查询变得如此复杂以至于它做错了而你花了一天时间来修复它...它们之间有平衡,像往常一样. (6认同)
@ user1735921只有当性能提升值得将来所需的维护时间增加时 (6认同)
联接具有更高的可读性和性能，但如果您在查询中使用太多联接（如 5-10），最好考虑进行一些优化并分解为两个查询或子查询，这将提高性能和可读性，这就是我从我的经验中学到的。 (2认同)
我的观点`Join`和`sub query`有不同的语法,所以我们无法比较的可读性,只要你的SQL语法很好,它们都具有更高的可读性.表现更重要. (2认同)
真实故事，join 比子查询快 (2认同)

Answer 4

使用EXPLAIN查看数据库如何对数据执行查询.在这个答案中有一个巨大的"取决于"......

当PostgreSQL认为一个子查询比另一个更快时,它可以将子查询重写为连接或子查询的连接.这一切都取决于数据,索引,相关性,数据量,查询等.

Answer 5

在2010年,我本来会加入这个问题的作者,并会有强烈的投票支持JOIN.但是有了更多的经验(特别是在MySQL中)我可以说:是的子查询可以更好.我在这里读过多个答案.有人说,子查询更快,但缺乏一个很好的解释.我希望我能提供这个(非常)迟到的答案:

首先,让我说最重要的是:有不同形式的子查询

第二个重要声明:规模问题

如果您使用子查询,您应该知道,DB-Server如何执行子查询.特别是如果子查询被评估一次或每行!另一方面,现代DB-Server能够进行大量优化.在某些情况下,子查询有助于优化查询,但较新版本的DB-Server可能会使优化过时.

选择字段中的子查询

SELECT moo, (SELECT roger FROM wilco WHERE moo = me) AS bar FROM foo