Jim*_*izz 4 streaming json http go
在过去,我使用go以如下所示的方式从API端点解码JSON.
client := &http.Client{}
req, err := http.NewRequest("GET", "https://some/api/endpoint", nil)
res, err := client.Do(req)
defer res.Body.Close()
buf, _ := ioutil.ReadAll(res.Body)
// ... Do some error checking etc ...
err = json.Unmarshal(buf, &response)
Run Code Online (Sandbox Code Playgroud)
我很快就要开发一个端点,它可以按以下格式向我发送几兆字节的JSON数据.
{
"somefield": "value",
"items": [
{ LARGE OBJECT },
{ LARGE OBJECT },
{ LARGE OBJECT },
{ LARGE OBJECT },
...
]
}
Run Code Online (Sandbox Code Playgroud)
JSON在某些时候将包含一个大的,任意长度的对象数组.我想将这些对象中的每一个分别放入消息队列中.我不需要解码对象本身.
如果我使用我的常规方法,这将在解码之前将整个响应加载到内存中.
是否有一种很好的方法可以拆分每个LARGE OBJECT项目,因为响应仍在流入并将其发送到队列中?我这样做是为了避免在内存中保存尽可能多的数据.
谢谢!
icz*_*cza 11
可以使用解码JSON流json.Decoder
.
有了Decoder.Decode()
,我们可以读取(解组)单个值,而无需使用和解组整个流.这很酷,但您的输入是"单个"JSON对象,而不是一系列JSON对象,这意味着调用Decoder.Decode()
将尝试用所有项(大对象)解组完整的JSON对象.
我们想要的是对单个JSON对象进行部分,即时处理.为此,我们可以使用Decoder.Token()
哪个解析(提前)JSON输入流中的下一个后续标记并返回它.这称为事件驱动的解析.
当然,我们必须"处理"(解释并采取行动)令牌,并构建一个"状态机",以跟踪我们正在处理的JSON结构中的位置.
这是一个解决您问题的实现.
我们将使用以下JSON输入:
{
"somefield": "value",
"otherfield": "othervalue",
"items": [
{ "id": "1", "data": "data1" },
{ "id": "2", "data": "data2" },
{ "id": "3", "data": "data3" },
{ "id": "4", "data": "data4" }
]
}
Run Code Online (Sandbox Code Playgroud)
并阅读items
,这种类型的"大对象":
type LargeObject struct {
Id string `json:"id"`
Data string `json:"data"`
}
Run Code Online (Sandbox Code Playgroud)
我们还将解析和解释JSON对象中的其他字段,但我们只会记录/打印它们.
为了简洁和简单的错误处理,我们将使用这个辅助错误处理函数:
he := func(err error) {
if err != nil {
log.Fatal(err)
}
}
Run Code Online (Sandbox Code Playgroud)
现在让我们看看一些动作.在下面的示例中为了简洁起见并在Go Playground上进行工作演示,我们将从一个string
值中读取.要从实际的HTTP响应体中读取,我们只需要更改一行,这就是我们创建的方式json.Decoder
:
dec := json.NewDecoder(res.Body)
Run Code Online (Sandbox Code Playgroud)
所以演示:
dec := json.NewDecoder(strings.NewReader(jsonStream))
// We expect an object
t, err := dec.Token()
he(err)
if delim, ok := t.(json.Delim); !ok || delim != '{' {
log.Fatal("Expected object")
}
// Read props
for dec.More() {
t, err = dec.Token()
he(err)
prop := t.(string)
if t != "items" {
var v interface{}
he(dec.Decode(&v))
log.Printf("Property '%s' = %v", prop, v)
continue
}
// It's the "items". We expect it to be an array
t, err := dec.Token()
he(err)
if delim, ok := t.(json.Delim); !ok || delim != '[' {
log.Fatal("Expected array")
}
// Read items (large objects)
for dec.More() {
// Read next item (large object)
lo := LargeObject{}
he(dec.Decode(&lo))
fmt.Printf("Item: %+v\n", lo)
}
// Array closing delim
t, err = dec.Token()
he(err)
if delim, ok := t.(json.Delim); !ok || delim != ']' {
log.Fatal("Expected array closing")
}
}
// Object closing delim
t, err = dec.Token()
he(err)
if delim, ok := t.(json.Delim); !ok || delim != '}' {
log.Fatal("Expected object closing")
}
Run Code Online (Sandbox Code Playgroud)
这将产生以下输出:
2009/11/10 23:00:00 Property 'somefield' = value
2009/11/10 23:00:00 Property 'otherfield' = othervalue
Item: {Id:1 Data:data1}
Item: {Id:2 Data:data2}
Item: {Id:3 Data:data3}
Item: {Id:4 Data:data4}
Run Code Online (Sandbox Code Playgroud)
在Go Playground上试试完整的工作示例.