提高PostgreSQL聚合性能

Cer*_*rin 6 sql database postgresql

在PostgreSQL中执行MAX(id)聚合的提高查询速度的最佳方法是什么?

我有一个与id相关的适度数量的记录,我可以在一秒内COUNT()例如

select count(id) as cnt from mytable where ref_id=2660

row   cnt
1     2844
Run Code Online (Sandbox Code Playgroud)

但是,当我尝试使用MAX()查找最新的记录ID时,查询需要将近5分钟.

select max(id) as id from mytable where ref_id=2660
Run Code Online (Sandbox Code Playgroud)

这是令人惊讶的,因为我已经发现PG出乎意料地快得多,查询复杂得多.为什么查询时间会有这么大的差异,特别是对于这么少的记录?什么是改善这种表现的最佳方法?

编辑:这是上面MAX()选择的查询计划:

"Result  (cost=219.84..219.85 rows=1 width=0)"
"  InitPlan 1 (returns $0)"
"    ->  Limit  (cost=0.00..219.84 rows=1 width=4)"
"          ->  Index Scan Backward using mytable_pkey on mytable  (cost=0.00..773828.42 rows=3520 width=4)"
"                Filter: ((id IS NOT NULL) AND (ref_id = 2660))"
Run Code Online (Sandbox Code Playgroud)

art*_*prs 3

我用谷歌搜索了一下,似乎 PostgreSQL(最高 8.4)不喜欢MAX并且MIN,它对表进行顺序扫描以获得结果。如果没有查询计划和版本,很难说这是你的情况。

您可以尝试这个解决方法。

SELECT id from mytable WHERE ref_id=2660 ORDER BY id DESC LIMIT 1
Run Code Online (Sandbox Code Playgroud)

编辑:确保您有一个带有 (ref_id, id) 的索引,否则表扫描/排序是不可避免的。