我知道下面的查询会导致错误 - 如果指定了SELECT DISTINCT,则ORDER BY项必须出现在选择列表中.
SELECT DISTINCT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
ORDER BY birthdate;
Run Code Online (Sandbox Code Playgroud)
这是什么原因?究竟发生了什么?如果我不使用DISTINCT或仅在SELECT或ORDER BY city中添加birthdate,它会给我一些输出,但不是错误.是因为SELECT DISTINCT city只给出了城市的结果集而没有别的吗?
编辑 - (我想这可能是我的问题的答案)
SELECT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
Run Code Online (Sandbox Code Playgroud)
考虑以上查询.不确定,但我认为这是它的工作原理 - 在幕后,SQL Server可能有一个包含所有列的结果集,但我们只显示了我将称之为"显示集"的城市列.因此,按城市或任何其他列排序是有效的.
当我们使用SELECT DISTINCT城市时,结果集会发生什么?SQL服务器在其结果集中不仅包含具有DISTINCT城市的行.它具有整个结果集,就像SELECT*查询生成的结果集一样.但是,它只显示基于城市的不同行.现在这个显示的集合可以根据出生日期进行排序吗?没有.
在一个拥有许多员工的城市,即许多生日,SQL服务器无法分辨应该使用哪个生日来订购显示的集合.这就是它显示错误消息的原因.
ype*_*eᵀᴹ 18
SELECT DISTINCT可以使用重写查询GROUP BY.所以查询:
SELECT DISTINCT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA' ;
Run Code Online (Sandbox Code Playgroud)
相当于:
SELECT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
GROUP BY city ;
Run Code Online (Sandbox Code Playgroud)
你也不能ORDER BY birthdate在这里使用.两个查询的原因相同.可能有许多(多个)行具有相同city但不同的行birthdate.哪一个应该用于订购(如果允许的话?)
但是,您可以将聚合函数与GROUP BY查询一起使用:
SELECT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
GROUP BY city
ORDER BY MIN(birthdate) ; -- or MAX(birthdate)
Run Code Online (Sandbox Code Playgroud)