我正在尝试以合理的性能执行以下查询:
UPDATE order_item_imprint SET item_new_id = oi.item_new_id
FROM order_item oi
INNER JOIN order_item_imprint oii ON oi.item_number = oii.item_id
Run Code Online (Sandbox Code Playgroud)
目前,它没有在8天内完成,所以我们杀了它.查询说明如下:

Merge Join (cost=59038021.60..33137238641.84 rows=1432184234121 width=1392)
Merge Cond: ((oi.item_number)::text = (oii.item_id)::text)
-> Nested Loop (cost=0.00..10995925524.15 rows=309949417305 width=1398)
-> Index Scan using unique_order_item_item_number on order_item oi (cost=0.00..608773.05 rows=258995 width=14)
-> Seq Scan on order_item_imprint (cost=0.00..30486.39 rows=1196739 width=1384)
-> Materialize (cost=184026.24..198985.48 rows=1196739 width=6)
-> Sort (cost=184026.24..187018.09 rows=1196739 width=6)
Sort Key: oii.item_id
-> Seq Scan on order_item_imprint oii (cost=0.00..30486.39 rows=1196739 width=6)
Run Code Online (Sandbox Code Playgroud)
我在两个表上都有索引,并且我确保比较字段的类型和大小相同.我现在正在尝试更改postgresql服务器配置以帮助,但我不确定它会.
order_item_imprint表的大小约为110万,磁盘占用空间为145MB,order_item表的大小约为3.
主要目标是我需要能够在几个小时的维护窗口中运行此操作以及其他几个查询.
在执行计划之前已经运行了自动真空和分析.