相关疑难解决方法(0)

选择每个GROUP BY组中的第一行？

正如标题所示,我想选择用a组成的每组行的第一行GROUP BY.

具体来说,如果我有一个purchases看起来像这样的表:

SELECT * FROM purchases;

Run Code Online (Sandbox Code Playgroud)

我的输出:

id | customer | total
---+----------+------
 1 | Joe      | 5
 2 | Sally    | 3
 3 | Joe      | 2
 4 | Sally    | 1

我想查询每个产品id的最大购买量(total)customer.像这样的东西:

SELECT FIRST(id), customer, FIRST(total)
FROM  purchases
GROUP BY customer
ORDER BY total DESC;

Run Code Online (Sandbox Code Playgroud)

预期产出:

FIRST(id) | customer | FIRST(total)
----------+----------+-------------
        1 | Joe      | 5
        2 | Sally    | 3

sql sqlite postgresql group-by greatest-n-per-group

Dav*_*ver

2018 03-26

1205
推荐指数

16
解决办法

95万
查看次数

优化GROUP BY查询以检索每个用户的最新记录

我在Postgres 9.2中有下表(简化形式)

CREATE TABLE log (
    log_date DATE,
    user_id  INTEGER,
    payload  INTEGER
);

Run Code Online (Sandbox Code Playgroud)

它每个用户和每天最多包含一条记录.每天将有大约500,000条记录,为期300天.每个用户的running_total总是在增加.

我想在特定日期之前有效地检索每个用户的最新记录.我的查询是:

SELECT user_id, max(log_date), max(payload) 
FROM log 
WHERE log_date <= :mydate 
GROUP BY user_id

Run Code Online (Sandbox Code Playgroud)

这非常慢.我也尝试过:

SELECT DISTINCT ON(user_id), log_date, payload
FROM log
WHERE log_date <= :mydate
ORDER BY user_id, log_date DESC;

Run Code Online (Sandbox Code Playgroud)

具有相同的计划,同样缓慢.

到目前为止,我在user_msg_log(aggr_date)上有一个索引,但没有多大帮助.我应该用什么其他索引来加快速度,还是以任何其他方式实现我的目标？

sql postgresql indexing greatest-n-per-group postgresql-performance

xpa*_*pad

2019 05-09

45
推荐指数

3
解决办法

3万
查看次数

为什么在PostgreSQL查询中排序DESC时会出现NULL值？

在订购查询降序或升序时,您何时会首先想要NULLS？

在我看来,绝大多数时候,无论是升序还是降序,所期望的行为都是NULLS LAST.相反,我们必须指定NULLS FIRST.

sql database postgresql null sql-order-by

Bry*_*yan

2014 01-07

9
推荐指数

1
解决办法

7117
查看次数

将索引添加到带时区的时间戳

我想改进这个慢查询，我想添加一个索引，但我不知道哪种索引类型更适合我的情况。

SELECT COUNT(*) ct FROM events
WHERE dtt AT TIME ZONE 'America/Santiago'
   >= date(now() AT TIME ZONE 'America/Santiago') + interval '1s'

Run Code Online (Sandbox Code Playgroud)

查询计划：

"Aggregate  (cost=128032.03..128032.04 rows=1 width=0) (actual time=3929.083..3929.083 rows=1 loops=1)"
"  ->  Seq Scan on events  (cost=0.00..125937.68 rows=837742 width=0) (actual time=113.080..3926.972 rows=25849 loops=1)"
"        Filter: (timezone('America/Santiago'::text, dtt) >= (date(timezone('America/Santiago'::text, now())) + '00:00:01'::interval))"
"        Rows Removed by Filter: 2487386"
"Planning time: 0.179 ms"
"Execution time: 3929.136 ms"

Run Code Online (Sandbox Code Playgroud)

查询获取当天事件的计数。
dtt 是带有时区列的时间戳。
我正在使用 Postgresql 9.4。

注意：根据 Erwin 的建议，查询运行得更快一些，但我认为还不够快。

"Aggregate  (cost=119667.76..119667.77 rows=1 width=0) (actual …

Run Code Online (Sandbox Code Playgroud)

sql postgresql indexing timezone count

Gok*_*oku

2015 08-17

6
推荐指数

1
解决办法

5476
查看次数

标签统计

postgresql ×4

sql ×4

greatest-n-per-group ×2

indexing ×2

count ×1

database ×1

group-by ×1

null ×1

postgresql-performance ×1

sql-order-by ×1

sqlite ×1

timezone ×1

选择每个GROUP BY组中的第一行？

优化GROUP BY查询以检索每个用户的最新记录

为什么在PostgreSQL查询中排序DESC时会出现NULL值？

将索引添加到带时区的时间戳

标签 统计

标签统计