jsonb 字段 PostgreSQL 内的深度搜索

Chu*_*ill 5 postgresql jsonb

我的数据示例如下所示:

{"city": "NY", 
"skills": [
{"soft_skills": "Analysis"},
{"soft_skills": "Procrastination"},
{"soft_skills": "Presentation"}
],
"areas_of_training": [
{"areas of training": "Visio"},
{"areas of training": "Office"}, 
{"areas of training": "Risk Assesment"}
]}
Run Code Online (Sandbox Code Playgroud)

我想运行一个查询来查找具有 soft_skills 的用户,Analysis并且可能运行另一个查询来查找其培训领域是VisioRisk Assesment

我的列类型是jsonb. 如何在这些深度嵌套的对象上实现搜索查询?城市工程一级查询使用SELECT * FROM mydata WHERE content::json->>'city'='NY';

我如何还可以使用 LIKE 关键字或字符串匹配来运行深度嵌套值的匹配?

Abe*_*sto 10

1)

SELECT * FROM mydata
WHERE content->'skills' @> '[{"soft_skills": "Analysis"}]';
Run Code Online (Sandbox Code Playgroud)

2)

SELECT * FROM mydata
WHERE content->'areas_of_training' @> '[{"areas of training": "Visio"},{"areas of training": "Risk Assesment"}]';
Run Code Online (Sandbox Code Playgroud)

关于 JSON(B) 运算符

PS:并准备好接受极慢的查询。我强烈建议考虑数据规范化


更新 LIKE

对于您的示例数据,它可能是:

SELECT * FROM mydata
WHERE EXISTS (
  SELECT *
  FROM jsonb_array_elements(content->'areas_of_training') as a
  WHERE a->>'areas of training' ilike '%vi%');
Run Code Online (Sandbox Code Playgroud)

但是查询高度取决于实际的 JSON 结构。

  • 考虑将数据自动导入到规范化表中。 (2认同)

kli*_*lin 6

用于json_array_elements()获取嵌套元素的值,示例:

select d.*
from mydata d,
json_array_elements(content->'skills')
where value->>'soft_skills' ilike '%analysis%';

select d.*
from mydata d,
json_array_elements(content->'areas_of_training')
where value->>'areas of training' ~* 'visio|office';
Run Code Online (Sandbox Code Playgroud)

查询可能会产生重复的行,因此使用 是合理的select distinct on (id),其中id是主键。

请注意,该函数的json_array_elements()成本很高,并且您不能使用与 Abelisto 的解决方案相反的索引。但是,如果您想访问嵌套 json 元素的值,则必须使用它。