提高PostgreSQL聚合性能

Question

提高PostgreSQL聚合性能

在PostgreSQL中执行MAX(id)聚合的提高查询速度的最佳方法是什么？

我有一个与id相关的适度数量的记录,我可以在一秒内COUNT()例如

select count(id) as cnt from mytable where ref_id=2660

row   cnt
1     2844

Run Code Online (Sandbox Code Playgroud)

但是,当我尝试使用MAX()查找最新的记录ID时,查询需要将近5分钟.

select max(id) as id from mytable where ref_id=2660

Run Code Online (Sandbox Code Playgroud)

这是令人惊讶的,因为我已经发现PG出乎意料地快得多,查询复杂得多.为什么查询时间会有这么大的差异,特别是对于这么少的记录？什么是改善这种表现的最佳方法？

编辑:这是上面MAX()选择的查询计划:

"Result  (cost=219.84..219.85 rows=1 width=0)"
"  InitPlan 1 (returns $0)"
"    ->  Limit  (cost=0.00..219.84 rows=1 width=4)"
"          ->  Index Scan Backward using mytable_pkey on mytable  (cost=0.00..773828.42 rows=3520 width=4)"
"                Filter: ((id IS NOT NULL) AND (ref_id = 2660))"

Run Code Online (Sandbox Code Playgroud)

Answer 1

art*_*prs 3

我用谷歌搜索了一下，似乎 PostgreSQL（最高 8.4）不喜欢MAX并且MIN，它对表进行顺序扫描以获得结果。如果没有查询计划和版本，很难说这是你的情况。

您可以尝试这个解决方法。

SELECT id from mytable WHERE ref_id=2660 ORDER BY id DESC LIMIT 1

Run Code Online (Sandbox Code Playgroud)

编辑：确保您有一个带有 (ref_id, id) 的索引，否则表扫描/排序是不可避免的。

归档时间：	14 年，8 月前
查看次数：	4262 次
最近记录：	7 年，1 月前