在任意嵌套的JSON数据中访问特定字段

aqu*_*ic7 13 python json dictionary list

{
  "status": "200",
  "msg": "",
  "data": {
    "time": "1515580011",
    "video_info": [
      {
          "announcement": "{\"announcement_id\":\"6\",\"name\":\"INS\\u8d26\\u53f7\",\"icon\":\"http:\\\/\\\/liveme.cms.ksmobile.net\\\/live\\\/announcement\\\/2017-08-18_19:44:54\\\/ins.png\",\"icon_new\":\"http:\\\/\\\/liveme.cms.ksmobile.net\\\/live\\\/announcement\\\/2017-10-20_22:24:38\\\/4.png\",\"videoid\":\"15154610218328614178\",\"content\":\"FOLLOW ME PLEASE\",\"x_coordinate\":\"0.22\",\"y_coordinate\":\"0.23\"}",
          "announcement_shop": "",
Run Code Online (Sandbox Code Playgroud)

如何从这个json中获取内容"关注我"?

replay_data = raw_replay_data['data']['video_info'][0]
announcement = replay_data['announcement']
Run Code Online (Sandbox Code Playgroud)

这抓住了一切['announcement'],我做不到['announcement']['content'].

这样做的正确方法是什么?

提前谢谢你帮我解决这个问题.

cs9*_*s95 23

在一行 -

>>> json.loads(data['data']['video_info'][0]['announcement'])['content']
'FOLLOW ME PLEASE'
Run Code Online (Sandbox Code Playgroud)

为了帮助您了解如何访问数据(因此您不必再次询问),您需要盯着您的数据.

首先,让我们很好地布置您的数据.您可以使用json.dumps(data, indent=4),也可以使用JSONLint.com等在线工具.

{
    'data': {
        'time': '1515580011',
        'video_info': [{
            'announcement': (    # ***
            """{
                "announcement_id": "6",
                "name": "INS\\u8d26\\u53f7",
                "icon": "http:\\\\/\\\\/liveme.cms.ksmobile.net\\\\/live\\\\/announcement\\\\/2017-08-18_19:44:54\\\\/ins.png",
                "icon_new": "http:\\\\/\\\\/liveme.cms.ksmobile.net\\\\/live\\\\/announcement\\\\/2017-10-20_22:24:38\\\\/4.png",
                "videoid": "15154610218328614178",
                "content": "FOLLOW ME PLEASE",
                "x_coordinate": "0.22",
                "y_coordinate": "0.23"
            }"""),
            'announcement_shop': ''
        }]
    },
    'msg': '',
    'status': '200'
} 
Run Code Online (Sandbox Code Playgroud)

***请注意,announcement密钥中的数据实际上是更多的 json数据,我已经在单独的行中列出了这些数据.

首先,找出数据所在的位置.您正在寻找的数据content键,这是由访问的announcement关键,这是类型的字典列表内的字典,可以由被访问的部分video_info关键,这又被访问data.

因此,总而言之,使用以下"梯级""下降"作为"数据"的梯子 -

  1. data, 一本字典
  2. video_info,一系列的词汇
  3. announcement,在词典列表的第一个词典中的一个词典
  4. content 作为json数据的一部分.

第一,

i = data['data']
Run Code Online (Sandbox Code Playgroud)

下一个,

j = i['video_info']
Run Code Online (Sandbox Code Playgroud)

下一个,

k = j[0] # since this is a list
Run Code Online (Sandbox Code Playgroud)

如果您只想要第一个元素,这就足够了.否则,你需要迭代:

for k in j:
    ...
Run Code Online (Sandbox Code Playgroud)

下一个,

l = k['announcement']
Run Code Online (Sandbox Code Playgroud)

现在,l是JSON数据.加载它 -

import json
m = json.loads(l)
Run Code Online (Sandbox Code Playgroud)

最后,

content = m['content']
Run Code Online (Sandbox Code Playgroud)

print(content)
'FOLLOW ME PLEASE'
Run Code Online (Sandbox Code Playgroud)

如果您将来有这种性质的问题,这应该可以作为指导.

  • 我们如何在这里有效地处理空情况。假设 JSON 中不存在 m['content'] (2认同)