只解析一个json级别

Question

只解析一个json级别

我有以下字符串:

'{
    "key1": "val1",
    "key2": ["a","b", 3],
    "key3": {"foo": 27, "bar": [1, 2, 3]}
}'

Run Code Online (Sandbox Code Playgroud)

我想只在级别上解析,所以结果应该是带键的一级字典,值应该只是一个字符串(不需要解析它)

对于给定的字符串,它应该给我以下字典:

{
    "key1": "val1",
    "key2": "['a','b', 3]",
    "key3": "{'foo': 27, 'bar': [1, 2, 3]}"
}

Run Code Online (Sandbox Code Playgroud)

有快速的方法吗？无需将整个字符串解析为json并将所有值转换回字符串.

Answer 1

oli*_*der 4

我认为你可以使用正则表达式解决这个问题，它对我有用：

import re
pattern = re.compile('"([a-zA-Z0-9]+)"\s*:\s*(".*"|\[.*\]|\{.*\})')    
dict(re.findall(pattern, json_string))

Run Code Online (Sandbox Code Playgroud)

但我不知道这是否更快，你需要尝试使用你的数据。

[编辑]

是的，它更快。我尝试了下面的脚本，正则表达式版本快了 5 倍。

使用 json 模块：

import json

val='''
{
    "key1": "val1",
    "key2": ["a","b", 3],
    "key3": {"foo": 27, "bar": [1, 2, 3]}
}
'''

for n in range(100000):
    dict((k,json.dumps(v)) for k,v in json.loads(val).items())

Run Code Online (Sandbox Code Playgroud)

使用正则表达式：

import re

val='''{
    "key1": "val1",
    "key2": ["a","b", 3],
    "key3": {"foo": 27, "bar": [1, 2, 3]}
}'''

pattern = re.compile('"([a-zA-Z0-9]+)"\s*:\s*(".*"|\[.*\]|\{.*\})')    
for n in range(100000):
    dict(re.findall(pattern, val))

Run Code Online (Sandbox Code Playgroud)

归档时间：	13 年，4 月前
查看次数：	3006 次
最近记录：	6 年，8 月前