Postgresql提取每个id的最后一行

Mar*_*rta 51 sql postgresql greatest-n-per-group

假设我有下一个数据

  id    date          another_info
  1     2014-02-01         kjkj
  1     2014-03-11         ajskj
  1     2014-05-13         kgfd
  2     2014-02-01         SADA
  3     2014-02-01         sfdg
  3     2014-06-12         fdsA
Run Code Online (Sandbox Code Playgroud)

我想为每个id提取最后的信息:

  id    date          another_info
  1     2014-05-13         kgfd
  2     2014-02-01         SADA
  3     2014-06-12         fdsA
Run Code Online (Sandbox Code Playgroud)

我怎么能管理呢?

a_h*_*ame 97

最有效的方法是使用Postgres' distinct on运算符

select distinct on (id) id, date, another_info
from the_table
order by id, date desc;
Run Code Online (Sandbox Code Playgroud)

如果您想要一个跨数据库工作的解决方案(但效率较低),您可以使用窗口函数:

select id, date, another_info
from (
  select id, date, another_info, 
         row_number() over (partition by id order by date desc) as rn
  from the_table
) t
where rn = 1
order by id;
Run Code Online (Sandbox Code Playgroud)

具有窗口函数的解决方案在大多数情况下比使用子查询更快.

  • upvoted!它需要一个关于日期desc的索引,我总是假设索引可以在两个方向上搜索,日期的升序默认主键索引应该适用于同一字段的降序,在我的情况下我有复合键(id,date)复合键导致问题? (4认同)

Viv*_* S. 12

select * 
from bar 
where (id,date) in (select id,max(date) from bar group by id)
Run Code Online (Sandbox Code Playgroud)

在PostgreSQL,MySQL中测试过

  • 如果单个 id 有多个具有相同日期的行,这将给出重复的结果 (3认同)

小智 7

我发现这是最快的解决方案:

 SELECT t1.*
   FROM yourTable t1
     LEFT JOIN yourTable t2 ON t2.tag_id = t1.tag_id AND t2.value_time > t1.value_time
  WHERE t2.tag_id IS NULL
Run Code Online (Sandbox Code Playgroud)