GROUP BY with MAX(DATE)

Ari*_*ies 140 sql oracle group-by greatest-n-per-group ora-00979

我正在尝试列出表格中每列火车的最新目的地(最近出发时间),例如:

Train    Dest      Time
1        HK        10:00
1        SH        12:00
1        SZ        14:00
2        HK        13:00
2        SH        09:00
2        SZ        07:00
Run Code Online (Sandbox Code Playgroud)

期望的结果应该是:

Train    Dest      Time
1        SZ        14:00
2        HK        13:00
Run Code Online (Sandbox Code Playgroud)

我试过用

SELECT Train, Dest, MAX(Time)
FROM TrainTable
GROUP BY Train
Run Code Online (Sandbox Code Playgroud)

我得到了一个"ora-00979不是GROUP BY表达式"错误,说我必须在我的分组中包含'Dest'语句.但肯定不是我想要的......

是否可以在一行SQL中执行此操作?

Thi*_*ilo 156

SELECT train, dest, time FROM ( 
  SELECT train, dest, time, 
    RANK() OVER (PARTITION BY train ORDER BY time DESC) dest_rank
    FROM traintable
  ) where dest_rank = 1
Run Code Online (Sandbox Code Playgroud)

  • @Aries - Thilo的答案优于Oliver,因为Thilo的答案往往会减少I/O. 分析函数允许SQL在一次传递中处理表,而Oliver的解决方案需要多次传递. (9认同)
  • 是的我同意.这个答案应该是"正确"的答案. (3认同)
  • @Ruslan,是的,我怜悯MySQL开发者. (2认同)

Oli*_*ppi 146

您不能在结果集中包含未聚合的非聚合列.如果列车只有一个目的地,那么只需将目标列添加到group by子句中,否则您需要重新考虑您的查询.

尝试:

SELECT t.Train, t.Dest, r.MaxTime
FROM (
      SELECT Train, MAX(Time) as MaxTime
      FROM TrainTable
      GROUP BY Train
) r
INNER JOIN TrainTable t
ON t.Train = r.Train AND t.Time = r.MaxTime
Run Code Online (Sandbox Code Playgroud)

  • 小心,如果最大(时间)存在"联系",这将无效,因为您将获得多行.您需要在上面的整个查询后面添加`group by train,dest`. (10认同)

Joe*_*yer 78

这是一个仅使用Left连接的示例,我相信通过方法比任何组更有效:ExchangeCore Blog

SELECT t1.*
FROM TrainTable t1 LEFT JOIN TrainTable t2
ON (t1.Train = t2.Train AND t1.Time < t2.Time)
WHERE t2.Time IS NULL;
Run Code Online (Sandbox Code Playgroud)

  • 令人大开眼界的是,有多少人一直说这个解决方案是"精彩"和"最好的",但没有人试过**.简单地说,**它不起作用.**正确的查询是:`选择t1.*来自TrainTable t1左连接TrainTable t2 on(t1.Train = t2.Train和t1.Time <t2.Time)其中t2 .Time是null. (12认同)
  • 我喜欢这种方法,因为它只使用标准的SQL,并且工作得非常好而且速度很快. (7认同)
  • 有意思,但我已经检查了我的MS SQL Server服务器(21000条记录),这比MAX + GROUP BY慢3倍 (4认同)
  • 非常慢!货币转换表包含字段date,from,to,rate.总计203161行.Joe Meyer方法给出了362行(31,29秒).Oliver Hanappi方法给出了362行(0,04秒) (4认同)
  • 这是最佳的优化答案 (2认同)

小智 12

另一种方案:

select * from traintable
where (train, time) in (select train, max(time) from traintable group by train);
Run Code Online (Sandbox Code Playgroud)

  • 小心,如果 max(time) 存在“关系”,这将不起作用,因为您将获得多行。改用这个:`select * from traintable where (train, time) in (select train, max(time) from traintable group by train) group by train,dest; ` (2认同)

Gar*_*ers 8

只要没有重复(火车往往只能一次到达一个车站)......

select Train, MAX(Time),
      max(Dest) keep (DENSE_RANK LAST ORDER BY Time) max_keep
from TrainTable
GROUP BY Train;
Run Code Online (Sandbox Code Playgroud)

  • “而火车往往一次只能到达一个车站”……未说明。 (2认同)

Gra*_*avy 5

我知道我参加聚会迟到了,但是试试这个...

SELECT 
    `Train`, 
    `Dest`,
    SUBSTRING_INDEX(GROUP_CONCAT(`Time` ORDER BY `Time` DESC), ",", 1) AS `Time`
FROM TrainTable
GROUP BY Train;
Run Code Online (Sandbox Code Playgroud)

源代码:Group Concat 文档

编辑:固定 sql 语法