使用 postgresql 10.6。我有一个名为place的表,其中包含城市的 jsonb 字段,其中包含一个 json 数组。我创造了杜松子酒指数。城市 json 数组将有数万条记录。我需要在 where 子句中查询该数组以获取 5000 个城市名称。该查询绝对应该使用 gin 索引来提高性能。正如我在执行计划中看到的那样,下面小提琴中的示例查询没有使用索引。应如何编写此查询以使用索引,使其运行速度更快。
表定义:
CREATE TABLE place (
cities jsonb NULL
);
CREATE INDEX "IX_place_cities" ON place USING gin (cities);
INSERT INTO place
(cities)
VALUES('[{"name": "paris", "continent": "europe"},
{"name": "london", "continent": "europe"},
{"name": "berlin", "continent": "europe"},
{"name": "istanbul", "continent": "europe"},
{"name": "prag", "continent": "europe"},
{"name": "rome", "continent": "europe"},
{"name": "wien", "continent": "europe"},
{"name": "tokyo", "continent": "asia"},
{"name": "beijing", "continent": "asia"},
{"name": "dakar", "continent": "africa"},
{"name": "daresselam", "continent": "africa"},
{"name": "kuala lumpur", "continent": "asia"},
{"name": "barcelona", "continent": "europe"}]');
Run Code Online (Sandbox Code Playgroud)
我的查询:
select elems.arrayitem
FROM (
select jsonb_array_elements(place.cities) as arrayitem
from place
) as elems
where elems.arrayitem @> '{"name": "paris"}'
or elems.arrayitem @> '{"name": "dakar"}'
Run Code Online (Sandbox Code Playgroud)
小智 5
一旦解除 JSON 的嵌套,就无法再使用索引。我想您正在寻找:
select jsonb_array_elements(p.cities) item
from place p
where p.cities @> '[{"name": "paris"}]'
or p.cities @> '[{"name": "dakar"}]'
Run Code Online (Sandbox Code Playgroud)
或者更明确地说:
select e.item
from place p
cross join jsonb_array_elements(p.cities) as e(item)
where p.cities @> '[{"name": "paris"}]'
or p.cities @> '[{"name": "dakar"}]'
Run Code Online (Sandbox Code Playgroud)
仅当表中有很多行(而不是数组中的元素!)并且 WHERE 条件将许多行减少到只有一些时,才会使用 GIN 索引。
如果您将所有内容存储在一行中的一个巨大 JSON 值中,则任何索引都不会改进您的查询。您应该规范化您的数据模型 - 这似乎很容易做到,因为您似乎没有任何动态结构并且所有元素共享相同的键(=列)。
| 归档时间: |
|
| 查看次数: |
1316 次 |
| 最近记录: |