相关疑难解决方法(0)

选择每个GROUP BY组中的第一行？

正如标题所示,我想选择用a组成的每组行的第一行GROUP BY.

具体来说,如果我有一个purchases看起来像这样的表:

SELECT * FROM purchases;

Run Code Online (Sandbox Code Playgroud)

我的输出:

id | customer | total
---+----------+------
 1 | Joe      | 5
 2 | Sally    | 3
 3 | Joe      | 2
 4 | Sally    | 1

我想查询每个产品id的最大购买量(total)customer.像这样的东西:

SELECT FIRST(id), customer, FIRST(total)
FROM  purchases
GROUP BY customer
ORDER BY total DESC;

Run Code Online (Sandbox Code Playgroud)

预期产出:

FIRST(id) | customer | FIRST(total)
----------+----------+-------------
        1 | Joe      | 5
        2 | Sally    | 3

sql sqlite postgresql group-by greatest-n-per-group

Dav*_*ver

2018 03-26

1205
推荐指数

16
解决办法

95万
查看次数

优化GROUP BY查询以检索每个用户的最新记录

我在Postgres 9.2中有下表(简化形式)

CREATE TABLE log (
    log_date DATE,
    user_id  INTEGER,
    payload  INTEGER
);

Run Code Online (Sandbox Code Playgroud)

它每个用户和每天最多包含一条记录.每天将有大约500,000条记录,为期300天.每个用户的running_total总是在增加.

我想在特定日期之前有效地检索每个用户的最新记录.我的查询是:

SELECT user_id, max(log_date), max(payload) 
FROM log 
WHERE log_date <= :mydate 
GROUP BY user_id

Run Code Online (Sandbox Code Playgroud)

这非常慢.我也尝试过:

SELECT DISTINCT ON(user_id), log_date, payload
FROM log
WHERE log_date <= :mydate
ORDER BY user_id, log_date DESC;

Run Code Online (Sandbox Code Playgroud)

具有相同的计划,同样缓慢.

到目前为止,我在user_msg_log(aggr_date)上有一个索引,但没有多大帮助.我应该用什么其他索引来加快速度,还是以任何其他方式实现我的目标？

sql postgresql indexing greatest-n-per-group postgresql-performance

xpa*_*pad

2019 05-09

45
推荐指数

3
解决办法

3万
查看次数

快速获取连接表中最新相关行的顶行

有两个表conversations和messages，我想获取对话及其最新消息的内容。

conversations- id(主键)、名称、创建时间

messages- id、内容、created_at、conversation_id

目前我们正在运行此查询来获取所需的数据

SELECT
    conversations.id,
    m.content AS last_message_content,
    m.created_at AS last_message_at
FROM
    conversations
INNER JOIN messages m ON conversations.id = m.conversation_id
                     AND m.id = (
    SELECT
        id
    FROM
        messages _m
    WHERE
        m.conversation_id = _m.conversation_id
    ORDER BY
        created_at DESC
    LIMIT 1)
ORDER BY
    last_message_at DESC
LIMIT 15
OFFSET 0

Run Code Online (Sandbox Code Playgroud)

上面的查询返回有效数据，但其性能随着行数的增加而降低。有没有其他方法可以提高性能来编写此查询？例如附加小提琴。

http://sqlfiddle.com/#!17/2decb/2

还尝试了已删除答案之一中的建议：

SELECT DISTINCT ON (c.id)
       c.id,
       m.content AS last_message_content,
       m.created_at AS last_message_at
  FROM conversations AS c
 INNER JOIN messages AS m …

Run Code Online (Sandbox Code Playgroud)

sql postgresql greatest-n-per-group postgresql-performance postgresql-13

Raj*_*ngh

2021 12-12

10
推荐指数

2
解决办法

373
查看次数

PostgreSQL区别和格式最快的方法

我在表中有350万行acs_objects,我需要检索creation_date具有年份格式和不同的列.

我的第一次尝试:180~200 Sec (15 Rows Fetched)

SELECT DISTINCT to_char(creation_date,'YYYY') FROM acs_objects

Run Code Online (Sandbox Code Playgroud)

我的第二次尝试:35~40 Sec (15 Rows Fetched)

SELECT DISTINCT to_char(creation_date,'YYYY')
FROM (SELECT DISTINCT creation_date FROM acs_objects) AS distinct_date

Run Code Online (Sandbox Code Playgroud)

有没有办法让它更快？ - "我需要在ADP网站上使用它"

sql postgresql aggregate distinct postgresql-performance

Leo*_*nto

2015 05-18

9
推荐指数

4
解决办法

1508
查看次数

在 PostgreSQL 上从 UNION ALL（不使用 UNION）删除重复项的最快方法？

我有一个包含数亿行的表，我想从同一个表的 2 个索引列中获取唯一值的单个列表（没有唯一的行 ID）。

为了说明这一点，假设我们有一个包含一fruits列和一veggies列的表，我想构建一个healthy_foods包含两列中唯一值的列表。

我尝试过以下查询：

与联盟

WITH cte as ( SELECT fruit, veggie FROM recipes ) SELECT fruit as healthy_food FROM cte UNION -- <--- SELECT veggie as healthy_food FROM cte;
Run Code Online (Sandbox Code Playgroud)
与 UNION ALL 然后 DISTINCT ON

WITH cte as (...) SELECT DISTINCT ON (healthy_food) healthy_food FROM -- <--- (SELECT fruit as healthy_food FROM cte UNION ALL -- <--- SELECT veggie as healthy_food FROM cte) tb;
Run Code Online (Sandbox Code Playgroud)
与 UNION …

sql postgresql query-optimization

Z. *_* M.

2021 04-26

6
推荐指数

1
解决办法

3548
查看次数

标签统计

postgresql ×5

sql ×5

greatest-n-per-group ×3

postgresql-performance ×3

aggregate ×1

distinct ×1

group-by ×1

indexing ×1

postgresql-13 ×1

query-optimization ×1

sqlite ×1

选择每个GROUP BY组中的第一行？

优化GROUP BY查询以检索每个用户的最新记录

快速获取连接表中最新相关行的顶行

PostgreSQL区别和格式最快的方法

在 PostgreSQL 上从 UNION ALL（不使用 UNION）删除重复项的最快方法？

标签 统计

标签统计