原因 - 如果指定了SELECT DISTINCT,则ORDER BY项必须出现在选择列表中

Ste*_*eam 4 sql sql-server

我知道下面的查询会导致错误 - 如果指定了SELECT DISTINCT,则ORDER BY项必须出现在选择列表中.

SELECT DISTINCT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
ORDER BY birthdate;
Run Code Online (Sandbox Code Playgroud)

这是什么原因?究竟发生了什么?如果我不使用DISTINCT或仅在SELECT或ORDER BY city中添加birthdate,它会给我一些输出,但不是错误.是因为SELECT DISTINCT city只给出了城市的结果集而没有别的吗?

编辑 - (我想这可能是我的问题的答案)

SELECT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
Run Code Online (Sandbox Code Playgroud)

考虑以上查询.不确定,但我认为这是它的工作原理 - 在幕后,SQL Server可能有一个包含所有列的结果集,但我们只显示了我将称之为"显示集"的城市列.因此,按城市或任何其他列排序是有效的.

当我们使用SELECT DISTINCT城市时,结果集会发生什么?SQL服务器在其结果集中不仅包含具有DISTINCT城市的行.它具有整个结果集,就像SELECT*查询生成的结果集一样.但是,它只显示基于城市的不同行.现在这个显示的集合可以根据出生日期进行排序吗?没有.

在一个拥有许多员工的城市,即许多生日,SQL服务器无法分辨应该使用哪个生日来订购显示的集合.这就是它显示错误消息的原因.

ype*_*eᵀᴹ 18

SELECT DISTINCT可以使用重写查询GROUP BY.所以查询:

SELECT DISTINCT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA' ;
Run Code Online (Sandbox Code Playgroud)

相当于:

SELECT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
GROUP BY city ;
Run Code Online (Sandbox Code Playgroud)

你也不能ORDER BY birthdate在这里使用.两个查询的原因相同.可能有许多(多个)行具有相同city但不同的行birthdate.哪一个应该用于订购(如果允许的话?)

但是,您可以将聚合函数与GROUP BY查询一起使用:

SELECT city
FROM HR.Employees
WHERE country = N'USA' AND region = N'WA'
GROUP BY city 
ORDER BY MIN(birthdate) ;               -- or MAX(birthdate)
Run Code Online (Sandbox Code Playgroud)