如何使用jq基于内部数组中的值过滤对象数组?

Abe*_*ker 209 arrays select json negation jq

鉴于此输入:

[
  {
    "Id": "cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b",
    "Names": [
      "condescending_jones",
      "loving_hoover"
    ]
  },
  {
    "Id": "186db739b7509eb0114a09e14bcd16bf637019860d23c4fc20e98cbe068b55aa",
    "Names": [
      "foo_data"
    ]
  },
  {
    "Id": "a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19",
    "Names": [
      "jovial_wozniak"
    ]
  },
  {
    "Id": "76b71c496556912012c20dc3cbd37a54a1f05bffad3d5e92466900a003fbb623",
    "Names": [
      "bar_data"
    ]
  }
]
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用jq构造一个过滤器,该过滤器返回内部数组中包含"data"的所有Ids 对象,输出为换行符.对于上面的数据,我想要的输出是Names

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19
Run Code Online (Sandbox Code Playgroud)

我想我跟这个有点接近:

(. - select(.Names[] contains("data"))) | .[] .Id
Run Code Online (Sandbox Code Playgroud)

select过滤器不正确,它不编译(get error: syntax error, unexpected IDENT).

Iai*_*der 321

很接近!在select表达式中,您必须先使用pipe(|)contains.

此过滤器生成预期输出.

. - map(select(.Names[] | contains ("data"))) | .[] .Id
Run Code Online (Sandbox Code Playgroud)

JQ食谱具有语法的一个例子.

根据键的内容过滤对象

例如,我只想要其类型键包含"house"的对象.

$ json='[{"genre":"deep house"}, {"genre": "progressive house"}, {"genre": "dubstep"}]'
$ echo "$json" | jq -c '.[] | select(.genre | contains("house"))'
{"genre":"deep house"}
{"genre":"progressive house"}
Run Code Online (Sandbox Code Playgroud)

Colin D询问如何保留数组的JSON结构,以便最终输出是单个JSON数组而不是JSON对象流.

最简单的方法是将整个表达式包装在数组构造函数中:

$ echo "$json" | jq -c '[ .[] | select( .genre | contains("house")) ]'
[{"genre":"deep house"},{"genre":"progressive house"}]
Run Code Online (Sandbox Code Playgroud)

您还可以使用地图功能:

$ echo "$json" | jq -c 'map(select(.genre | contains("house")))'
[{"genre":"deep house"},{"genre":"progressive house"}]
Run Code Online (Sandbox Code Playgroud)

map解压缩输入数组,将过滤器应用于每个元素,并创建一个新数组.换句话说,map(f)相当于[.[]|f].

  • @ColinD我对reduce解决方案并不满意,所以我用map函数的解释替换了它.这有帮助吗? (4认同)
  • 谢谢,效果很好!我确实看到了那个例子,我只是没能将它适应我的场景:-) (3认同)

jq1*_*727 12

这是使用任何/ 2的另一种解决方案

map(select(any(.Names[]; contains("data"))|not)|.Id)[]
Run Code Online (Sandbox Code Playgroud)

使用示例数据及其-r生成的选项

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19
Run Code Online (Sandbox Code Playgroud)

  • 啊,这是`any(generator; condition)`形式。我发现如果不对同一对象多次执行select()匹配,而没有使用any(),结果将重复。 (3认同)

Rag*_*dda 5

过滤器(演示):

.[] | select( [ .Names[] | contains("data") ] | any) | .Id
Run Code Online (Sandbox Code Playgroud)

解释:

  • .[]解压数组,以便我们迭代数组中的每个元素
  • select(<condition>)只保留满足条件的元素。.Names条件是该元素的数组中至少有一个名称包含data该单词。
    • .Names[] | contains ("data")解包.Names每个元素的数组并检查每个名称是否包含文本data。此时,我们有一个与.Names该元素数组长度相同的布尔数组。
    • [.Names[] | contains ("data") ] | any获取该布尔值数组并将其折叠为单个布尔值,因为该any函数检查该数组中至少有一个元素是true。有效地使用select该值作为条件。
  • .Id提取Id通过的元素的属性。