相关疑难解决方法(0)

大型对象上的JSON.parse()使用的内存比它应该的多

我生成一个~200'000元素的对象数组(使用对象文字符号map而不是new Constructor()),我将它的JSON.stringify'd版本保存到磁盘,它需要31 MB,包括换行符和一个空格 - per-indentation level(JSON.stringify(arr, null, 1)).

然后,在新的节点进程中,我将整个文件读入UTF-8字符串并将其传递给JSON.parse:

var fs = require('fs');
var arr1 = JSON.parse(fs.readFileSync('JMdict-all.json', {encoding : 'utf8'}));

Run Code Online (Sandbox Code Playgroud)

根据Mavericks的Activity Monitor,节点内存使用量约为1.05 GB!即使打入终端,我的古老4 GB RAM机器也会感觉更加懒散.

但是,如果在一个新的节点进程中,我将文件的内容加载到一个字符串中,在元素边界处切断它,并且JSON.parse每个元素单独地,表面上获得相同的对象数组:

var fs = require('fs');
var arr2 = fs.readFileSync('JMdict-all.json', {encoding : 'utf8'}).trim().slice(1,-3).split('\n },').map(function(s) {return JSON.parse(s+'}');});

Run Code Online (Sandbox Code Playgroud)

节点只使用~200 MB的内存,没有明显的系统滞后.这种模式在节点的多次重启中持续存在:JSON.parse整个数组需要一大堆内存,而在元素方面解析它需要更高的内存效率.

为什么内存使用存在如此巨大的差异？这是否会JSON.parse妨碍在V8中生成有效的隐藏类？如何在没有切片和切块的情况下获得良好的内存性能？我必须使用流式JSON解析吗？

为了便于实验,我将JSON文件置于Gist中,请随意克隆它.

javascript arrays parsing json node.js

Ahm*_*sih

2015 06-01

11
推荐指数

1
解决办法

9746
查看次数