为什么 ActiveSupport::JSON.encode 这么慢?

Kar*_*arl 6 ruby json ruby-on-rails jruby ruby-on-rails-4

JRuby 9.2,Rails 4.2

我一直在读取/转储大型 JSON 对象,100+MB 的文件,这些文件通常会挂起几分钟,然后在写出它们时内存不足。

我注意到它在使用to_json. 下面是一个 4MB 的文件,所以它实际上完成了:

pry(main)> f = File.open('nvdcve-1.0-recent.json'){|f| JSON.load(f) }
pry(main)> puts Benchmark.measure{ JSON.dump(f) }
  0.230000   0.010000   0.240000 (  0.081894)
=> nil
pry(main)> puts Benchmark.measure{ f.to_json }
  1.020000   0.020000   1.040000 (  0.820851)
=> nil
Run Code Online (Sandbox Code Playgroud)

问题的根源在于 ActiveSupport 覆盖to_json了很多东西:

pry(main)> f.method(:to_json)
=> #<Method: Hash#to_json(to_json_with_active_support_encoder)>
pry(main)> puts Benchmark.measure{ f.to_json_without_active_support_encoder }
  0.040000   0.000000   0.040000 (  0.035408)
pry(main)> puts Benchmark.measure{ f.to_json_with_active_support_encoder }
  1.170000   0.010000   1.180000 (  0.812674)
Run Code Online (Sandbox Code Playgroud)

请参阅此处:https : //apidock.com/rails/Object/to_json_with_active_support_encoder

那么究竟是ActiveSupport::JSON.encode什么与 JSON gem 的不同之to_json处导致它变得如此缓慢,即使是在从 JSON 文件开始加载的不起眼的 JSON 文件上?

如果我to_json不使用 ActiveSupport 变体,我会破坏任何 Rails 功能吗?

Sch*_*ern 6

tl;drActiveSupport::JSON#encode正在做三件额外的事情。

  1. 调用as_json要求每个对象提供适合序列化的数据结构。
  2. 将数据“json化”为 JSON 原语并处理递归。
  3. 在字符串中转义 HTML

JSON.dump决定事物如何变成 JSON,你无法控制。回调as_json允许您准确控制对象的转储方式。对于简单的对象,这会增加一些开销。对于其他一切来说,这都非常重要。

jsonify使倾倒物体变得更容易。大约 29% 的时间它会被咀嚼。

这允许开发人员实现#as_json,而不必担心允许返回哪些基本类型的对象,也不必记住递归调用#as_json。

转义 HTML 允许人们将 JSON 放入 HTML 页面中。这大约是 38% 的时间。耗费这么多时间,作用有限。不幸的是它不能轻易关闭。这可能是一个有价值的补丁。

只有 10% 花费在真正的 JSON 编码器中。这与我的基准测试结果大致一致。

[12] pry(main)> puts Benchmark.measure{ ActiveSupport::JSON.encode(h) }
  1.241299   0.009459   1.250758 (  1.253938)
=> nil
[13] pry(main)> puts Benchmark.measure{ JSON.dump(h) }
  0.117118   0.003333   0.120451 (  0.120881)
Run Code Online (Sandbox Code Playgroud)

注意:这是 Ruby 2.6.3 和 Rails 5.2.3 的情况。这就是我所得到的,旧版本的性能问题不太有趣。你可以自己运行它们,我希望它是一样的。

运行它,ruby-prof我们可以看到JSON.dump所有的时间都花在了几个函数上。

$ rails -e 'require "json"; require "ruby-prof"; h = File.open("nvdcve-1.0-recent.json"){|f| JSON.load(f) }; result = RubyProf.profile { JSON.dump(h) }; printer = RubyProf::GraphPrinter.new(result); printer.print(STDOUT, {})' > json.prof
Run Code Online (Sandbox Code Playgroud)
------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.275      0.134      0.000      0.141              1/1     <Module::JSON>#generate
  99.98%  48.78%      0.275      0.134      0.000      0.141                1     JSON::Ext::Generator::State#generate 
                      0.097      0.097      0.000      0.000    401143/401143     String#encode
                      0.021      0.021      0.000      0.000    101047/101047     Hash#keys
                      0.021      0.021      0.000      0.000    213358/213358     String#to_s
                      0.001      0.001      0.000      0.000        2058/2058     Float#to_s
------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.097      0.097      0.000      0.000    401143/401143     JSON::Ext::Generator::State#generate
  35.26%  35.26%      0.097      0.097      0.000      0.000           401143     String#encode                  
------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.021      0.021      0.000      0.000    101047/101047     JSON::Ext::Generator::State#generate
   7.79%   7.79%      0.021      0.021      0.000      0.000           101047     Hash#keys                      
------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.021      0.021      0.000      0.000    213358/213358     JSON::Ext::Generator::State#generate
   7.77%   7.77%      0.021      0.021      0.000      0.000           213358     String#to_s                    
------------------------------------------------------------------------------------------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)
  • 49% 实际生成 JSON。
  • 8% 迭代哈希键。
  • 35% String#encode,大概是为了确保所有字符串都UTF-8符合要求。
  • 8% 将事物串起来。

现在与ActiveSupport::JSON.encode(h). 由于某种原因,它h.to_json不能encode从命令行执行,但可以在控制台中执行。

$ rails -e 'require "json"; require "ruby-prof"; h = File.open("nvdcve-1.0-recent.json"){|f| JSON.load(f) }; result = RubyProf.profile { ActiveSupport::JSON.encode(h) }; printer = RubyProf::GraphPrinter.new(result); printer.print(STDOUT, {})' > as.prof
Run Code Online (Sandbox Code Playgroud)

它的外形比较复杂。从顶部开始。

------------------------------------------------------------------------------------------------------------------------------------------------------
                      3.020      0.000      0.000      3.020              1/1     <Module::ActiveSupport::JSON>#encode
  96.58%   0.00%      3.020      0.000      0.000      3.020                1     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:34
                      1.483      0.000      0.000      1.483              1/1     ActiveSupport::JSON::Encoding::JSONGemEncoder#stringify
                      0.894      0.000      0.000      0.894         1/519065     ActiveSupport::JSON::Encoding::JSONGemEncoder#jsonify
                      0.643      0.000      0.000      0.643         1/101047     Hash#as_json
                      0.000      0.000      0.000      0.000         1/305710     Kernel#dup
------------------------------------------------------------------------------------------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

它95%的时间都花在ActiveSupport::JSON::Encoding::JSONGemEncoder#encode.

def encode(value)
  stringify jsonify value.as_json(options.dup)
end
Run Code Online (Sandbox Code Playgroud)

value.as_json要求值返回它想要序列化为 JSON 的数据结构。这分散在不同的方法中。

这些本身并不会占用很多时间,但它们确实会递归占用总时间的 21%。

------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.634      0.009      0.000      0.625      9800/101047     Hash#each
                      0.642      0.075      0.000      0.567     91246/101047     Array#map
                      0.643      0.000      0.000      0.643         1/101047     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode
  20.56%   2.69%      0.643      0.084      0.000      0.559           101047    *Hash#as_json                   /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:157
                      0.643      0.031      0.000      0.612    101047/202094     Enumerable#map
                      0.036      0.036      0.000      0.000    101047/202094     <Class::Hash>#[]
------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.643      0.003      0.000      0.639      10311/10311     Hash#each
  20.56%   0.11%      0.643      0.003      0.000      0.639            10311    *Array#as_json                  /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:151
                      0.643      0.051      0.000      0.592      10311/20623     Array#map
------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.000      0.000      0.000      0.000      1102/187785     Array#map
                      0.033      0.033      0.000      0.000    186683/187785     Hash#each
   1.05%   1.05%      0.033      0.033      0.000      0.000           187785     String#as_json                 /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:86
------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.001      0.001      0.000      0.000        2058/4116     Hash#each
                      0.001      0.001      0.000      0.000        2058/4116     ActiveSupport::JSON::Encoding::JSONGemEncoder#jsonify
   0.05%   0.04%      0.002      0.001      0.000      0.000             4116     Float#as_json                  /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:106
                      0.000      0.000      0.000      0.000        4116/4116     Float#finite?
------------------------------------------------------------------------------------------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

jsonifyas_json结构转换为 JSON 原语。“这使得开发人员可以实现 #as_json,而不必担心他们可以返回哪些基本类型的对象,也不必记住递归调用 #as_json。” 这大约占用了总时间的 29%。

------------------------------------------------------------------------------------------------------------------------------------------------------
                      0.894      0.107      0.000      0.787     92348/519065     Array#map
                      0.894      0.224      0.000      0.670    426716/519065     Hash#each
                      0.894      0.000      0.000      0.894         1/519065     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode
  28.60%  10.59%      0.894      0.331      0.000      0.563           519065    *ActiveSupport::JSON::Encoding::JSONGemEncoder#jsonify /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:85
                      0.894      0.036      0.000      0.858    101047/202094     Enumerable#map
                      0.894      0.029      0.000      0.866      10311/20623     Array#map
                      0.193      0.129      0.000      0.064    401143/401153     Class#new
                      0.130      0.130      0.000      0.000  1104275/1104283     Module#===
                      0.031      0.031      0.000      0.000    101047/202094     <Class::Hash>#[]
                      0.001      0.001      0.000      0.000        2058/4116     Float#as_json
                      0.001      0.001      0.000      0.000        2533/5066     FalseClass#as_json
                      0.000      0.000      0.000      0.000        1973/3946     TrueClass#as_json
------------------------------------------------------------------------------------------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)
  • stringify把所有的东西都交给JSON.generate
------------------------------------------------------------------------------------------------------------------------------------------------------
                      1.483      0.000      0.000      1.483              1/1     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode
  47.42%   0.00%      1.483      0.000      0.000      1.483                1     ActiveSupport::JSON::Encoding::JSONGemEncoder#stringify /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:101
                      1.483      0.000      0.000      1.483              1/1     <Module::JSON>#generate
------------------------------------------------------------------------------------------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

JSON.generateJSON::Ext::Generator::State#generate占用总时间 47% 的调用。但是38%花在了ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_json,这个方法转义了HTML。这意味着实际生成 JSON 所花费的时间仅为运行时间的 10%。这与基准测试结果相符。

------------------------------------------------------------------------------------------------------------------------------------------------------
                      1.483      0.228      0.000      1.254              1/1     <Module::JSON>#generate
  47.42%   7.31%      1.483      0.228      0.000      1.254                1     JSON::Ext::Generator::State#generate 
                      1.176      0.271      0.000      0.905    401143/401143     ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_json
                      0.040      0.040      0.000      0.000    213358/213358     ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_s
                      0.037      0.037      0.000      0.000    101047/101047     Hash#keys
                      0.001      0.001      0.000      0.000        2058/2058     Float#to_s
------------------------------------------------------------------------------------------------------------------------------------------------------
                      1.176      0.271      0.000      0.905    401143/401143     JSON::Ext::Generator::State#generate
  37.63%   8.68%      1.176      0.271      0.000      0.905           401143     ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_json /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:55
                      0.614      0.209      0.000      0.405    401143/401143     ActiveSupport::ToJsonWithActiveSupportEncoder#to_json
                      0.292      0.292      0.000      0.000    401143/401143     String#gsub
------------------------------------------------------------------------------------------------------------------------------------------------------```
Run Code Online (Sandbox Code Playgroud)


max*_*max 5

根据来源ActiveSupport::JSON 几乎只是 JSON gem 之上的一个附加层 - 它实际上完成了大部分繁重的工作。它主要做的事情是:

转义一些在某些浏览器中可能出现问题的附加字符。

ESCAPED_CHARS = {
            "\u2028" => '\u2028',
            "\u2029" => '\u2029',
            ">"      => '\u003e',
            "<"      => '\u003c',
            "&"      => '\u0026',
            }
Run Code Online (Sandbox Code Playgroud)

这些评论没有说明有问题的浏览器是什么,这对于现代浏览器来说可能完全不是问题。

将对象转换为合适的 JSON 表示形式:

      # Convert an object into a "JSON-ready" representation composed of
      # primitives like Hash, Array, String, Numeric,
      # and +true+/+false+/+nil+.
      # Recursively calls #as_json to the object to recursively build a
      # fully JSON-ready object.
      #
      # This allows developers to implement #as_json without having to
      # worry about what base types of objects they are allowed to return
      # or having to remember to call #as_json recursively.
      #
      # Note: the +options+ hash passed to +object.to_json+ is only passed
      # to +object.as_json+, not any of this method's recursive +#as_json+
      # calls.
      def jsonify(value)
        case value
        when String
          EscapedString.new(value)
        when Numeric, NilClass, TrueClass, FalseClass
          value.as_json
        when Hash
          Hash[value.map { |k, v| [jsonify(k), jsonify(v)] }]
        when Array
          value.map { |v| jsonify(v) }
        else
          jsonify value.as_json
        end
      end
Run Code Online (Sandbox Code Playgroud)

这可能是最重要的部分,因为它#as_json对于模型如何将自身呈现为 JSON 非常关键。它还处理转换日期和时间戳以及其他非基元(ActiveSupport 提供了#as_json这些方法)。删除这个很可能会破坏很多东西。

根据您的用例,您也许可以从模型对象手动创建 ruby​​ 对象(数组、哈希等)并使用JSON.generate(data)- 但我不确定它会表现得更好。