重新编写子选择作为使用“over(partition by ...)”生成的列的条件

aje*_*jeh 2 sql-server sql-server-2008-r2 window-functions

我想知道是否可以使用over (partition by...)子句以避免在下面的示例中使用子选择:

declare @t table (
     id         int
    ,code       char(2)
    ,descriptor int
)

insert into @t
      select 1, 'a1', 10
union select 1, 'a1', 20
union select 1, 'a1', 30
union select 2, 'b1', 10
union select 2, 'b1', 20
union select 2, 'b1', 30
union select 2, 'b2', 10
union select 2, 'b2', 20
union select 2, 'b2', 30
union select 3, 'c4', 10
union select 3, 'c4', 20
union select 3, 'c4', 30
union select 3, 'c7', 10
union select 3, 'c7', 20
union select 3, 'c7', 30


select *
from @t as t
where code = (select min(code) from @t where id = t.id)
Run Code Online (Sandbox Code Playgroud)

我只想查看code等于a1,b1和的记录c4。可以over (partition by...)将 1 分配给所有这些,将 2 分配给b2c7代码等,以便最后我可以说where row_number = 1而不是使用子查询?

ype*_*eᵀᴹ 9

是的,但不是row_number()。您可以使用窗口聚合min()

select id, code, descriptor
from 
  ( select id, code, descriptor, 
           min_code = min(code) over (partition by id)
    from @t
  ) as t
where code = min_code ;
Run Code Online (Sandbox Code Playgroud)

rank()窗口函数(或窗口函数dense_rank(),它们对rnk = 1支票的作用相同):

select id, code, descriptor
from 
  ( select id, code, descriptor, 
           rnk = rank() over (partition by id order by code)
    from @t
  ) as t
where rnk = 1 ;
Run Code Online (Sandbox Code Playgroud)

我正要评论说,如果没有任何类型的子查询(相关的、派生的表、ctes),就没有办法做到这一点,但唉,有。不是在 2008R2 中,而是在 2012 版本中使用了一个窗口函数。

注意:不要使用这个。效率可能会更差。以下查询可能适用于混淆竞赛,但不适用于生产。

相反,当有合适的索引时,检查上述第二个查询的良好执行计划。

只是为了好玩 - 以及代码未来维护者的恐惧:

select distinct
    id, 
    code = min(code) over (partition by id),
    descriptor = 
        case when code = min(code) over (partition by id)
            then descriptor
            else first_value(descriptor) over 
                    (partition by id order by code, descriptor)
        end
from @t ;
Run Code Online (Sandbox Code Playgroud)

SQLFiddle测试

  • @ajeh `这个想法是不使用子查询。` 为什么?尖头boss认为所有子查询都不好?正如 aasim 所说,你不能在 `WHERE` 子句中使用像 `rank()` 或 `row_number()` 这样的表达式的别名。所以也许你应该回到绘图板并通过删除任何和所有子查询来解释你实际上试图*解决*什么问题...... (3认同)
  • @ajeh:这是一个派生表,而不是相关子查询。但是,是的,它们都被称为“子查询”。 (2认同)

Mar*_*ith 7

另一种方式(满足要求并与 2005+ 兼容,但在实践中可能永远不会使用)是

SELECT TOP 1 WITH ties id,
                       code,
                       descriptor
FROM   t
WHERE  id IS NOT NULL
       AND code IS NOT NULL
ORDER  BY RANK()
            OVER (PARTITION BY id
                      ORDER BY code); 
Run Code Online (Sandbox Code Playgroud)

虽然TOP以这种方式使用一个有趣的答案 (ab)不如简单地使用某种形式的派生表并在其中过滤WHERE

如果不将其包装在表表达式中,您将无法对此查询的结果应用任何其他排序。由于电流ORDER BY必须保持不变,以避免改变结果。

SQL小提琴


Aar*_*and 6

当然,您也可以使用 CTE 编写此代码:

;WITH t AS
(
  SELECT id, code, descriptor, 
    min_code = MIN(code) OVER (PARTITION BY id)
  FROM @t
)
SELECT id, code, descriptor 
FROM t WHERE code = min_code;
Run Code Online (Sandbox Code Playgroud)

不能说:

SELECT id, code, descriptor
FROM @t 
WHERE code = MIN(code) OVER (PARTITION BY id);
Run Code Online (Sandbox Code Playgroud)

因为:

Msg 4108, Level 15, State 1, Line 33
窗口函数只能出现在 SELECT 或 ORDER BY 子句中。

对此完全不清楚:

这个想法是不使用子查询。

但是,也许盲目拒绝子查询想法的人没有足够的智慧认识到 CTE 只是穿着不同服装的子查询。(事实上​​,很多人不认得 CTE 有时既是福也是祸。)

否则,请重新开始,并解释为什么需要完全删除子查询。对于某些问题(例如应用窗口函数),别无选择,只能在不同的范围内对其进行过滤 - 这意味着子查询、派生表、CTE 等......所有类型的子查询。