Postgis ST_Intersects 两个表之间真的（真的真的）慢

Question

Postgis ST_Intersects 两个表之间真的（真的真的）慢

我正在尝试在两个表之间进行空间连接：

表 1：397265 个特征（带有 geom 字段的要点索引）
表 2：73 个特征（在 geom 字段上有要点索引）

表 1 和表 2 具有相同的 SRID。

我做了很多测试，这些表之间的空间连接需要几天时间（5 天后我终止了查询）。我试图理解为什么解释分析这么慢：

EXPLAIN ANALYZE 
SELECT 
    table1.id,  table2.id
FROM table1
INNER JOIN table2 ON ST_Intersects(
        ST_Buffer(table1.geom,0),
        ST_Buffer(table2.geom,0)
)

Run Code Online (Sandbox Code Playgroud)

但是现在我仍在等待结果，因为 EXPLAIN ANALYZE 确实执行了查询。

如果我只做一个解释，结果是：

"Gather  (cost=1000.00..3820127.08 rows=9667 width=40)"
"  Workers Planned: 3"
"  ->  Nested Loop  (cost=0.00..3818111.26 rows=3118 width=40)"
"        Join Filter: ((st_buffer(table2.geom, '0'::double precision) && st_buffer(table1.geom, '0'::double precision)) AND _st_intersects(st_buffer(table2.geom, '0'::double precision), st_buffer(table1.geom, '0'::double precision)))"
"        ->  Parallel Seq Scan on table1  (cost=0.00..21964.50 rows=128150 width=344)"
"        ->  Seq Scan on table2  (cost=0.00..9.73 rows=73 width=714516)"

Run Code Online (Sandbox Code Playgroud)

我还更新了有关我计算机配置的 postgresql 配置文件：

shared_buffers = 8GB
effective_cache_size = 24GB
maintenance_work_mem = 2GB
checkpoint_completion_target = 0.9
wal_buffers = 16MB
default_statistics_target = 100
random_page_cost = 4
effective_io_concurrency = 2
work_mem = 10485kB
min_wal_size = 1GB
max_wal_size = 2GB
max_worker_processes = 7
max_parallel_workers_per_gather = 4
max_parallel_workers = 7

Run Code Online (Sandbox Code Playgroud)

你能告诉我它是什么东西这么长吗？

Answer 1

JGH*_*JGH 5

不使用空间索引。

你可以放下这个buffer东西（也许先修复你的几何形状......）

INNER JOIN table2 ON ST_Intersects(table1.geom,table2.geom)

Run Code Online (Sandbox Code Playgroud)

或者您可以在缓冲的几何图形上创建索引

CREATE INDEX geom_idx ON table1 USING gist (ST_Buffer(table1.geom,0));

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，4 月前
查看次数：	1436 次
最近记录：	6 年，4 月前