什么在Ruby中更快,`arr + = [x]`或`arr << x`

Question

什么在Ruby中更快,`arr + = [x]`或`arr << x`

DNN*_*NNX 11 ruby arrays performance benchmarking microbenchmark

直观地说,后者应该比前者更快.但是,当我看到基准测试结果时,我感到非常惊讶:

  require 'benchmark/ips'

  b = (0..20).to_a;
  y = 21;
  Benchmark.ips do |x|
    x.report('<<')   { a = b.dup; a << y }
    x.report('+=')   { a = b.dup; a += [y] }
    x.report('push') { a = b.dup; a.push(y) }
    x.report('[]=')  { a = b.dup; a[a.size]=y }
    x.compare!
  end

Run Code Online (Sandbox Code Playgroud)

结果是:

Calculating -------------------------------------
                  <<    24.978k i/100ms
                  +=    30.389k i/100ms
                push    24.858k i/100ms
                 []=    22.306k i/100ms
-------------------------------------------------
                  <<    493.125k (± 3.2%) i/s -      2.473M
                  +=    599.830k (± 2.3%) i/s -      3.009M
                push    476.374k (± 3.3%) i/s -      2.386M
                 []=    470.263k (± 3.8%) i/s -      2.364M

Comparison:
                  +=:   599830.3 i/s
                  <<:   493125.2 i/s - 1.22x slower
                push:   476374.0 i/s - 1.26x slower
                 []=:   470262.8 i/s - 1.28x slower

Run Code Online (Sandbox Code Playgroud)

然而,当我的一位同事独立创建自己的基准时,结果恰恰相反:

 Benchmark.ips do |x|
   x.report('push') {@a = (0..20).to_a; @a.push(21)}
   x.report('<<')   {@b = (0..20).to_a; @b << 21}
   x.report('+=')   {@c = (0..20).to_a; @c += [21]}
   x.compare!
 end

Run Code Online (Sandbox Code Playgroud)

结果:

Calculating -------------------------------------
                push    17.623k i/100ms
                  <<    18.926k i/100ms
                  +=    16.079k i/100ms
-------------------------------------------------
                push    281.476k (± 4.2%) i/s -      1.410M
                  <<    288.341k (± 3.6%) i/s -      1.457M
                  +=    219.774k (± 8.3%) i/s -      1.093M

Comparison:
                  <<:   288341.4 i/s
                push:   281476.3 i/s - 1.02x slower
                  +=:   219774.1 i/s - 1.31x slower

Run Code Online (Sandbox Code Playgroud)

我们还跨越了我们的基准测试,在我们的两台机器上,他的基准测试显示+=速度明显慢于<<我的基准测试,而我的基准测试显示相反.

这是为什么？

UPD:我的Ruby版本是Ruby 2.2.3p173(2015-08-18修订版51636)[x86_64-darwin14] ; 我的同事是2.2.2(不知道详情,明天会更新帖子).

UPD2:ruby 2.2.2p95(2015-04-13修订版50295)[x86_64-darwin12.0]我的队友的Ruby版本.

Answer 1

Wan*_*ker 5

在我看来,为了简化各种运算符的比较,我们应该删除不必要的代码并保持测试简单.

require 'benchmark/ips'

y = 10
Benchmark.ips do |x|
    x.report('<<')   { a = [0,1,2,3,4,5,6,7,8,9]; a << y }
    x.report('+=')   { a = [0,1,2,3,4,5,6,7,8,9]; a += [y] }
    x.report('push') { a = [0,1,2,3,4,5,6,7,8,9]; a.push(y) }
    x.report('[]=')  { a = [0,1,2,3,4,5,6,7,8,9]; a[a.size]=y }
    x.compare!
end

Run Code Online (Sandbox Code Playgroud)

上述代码的结果与问题中共享的第二个代码段一致.

Calculating -------------------------------------
                  <<   101.735k i/100ms
                  +=   104.804k i/100ms
                push    92.863k i/100ms
                 []=    99.604k i/100ms
-------------------------------------------------
                  <<      2.134M (± 3.3%) i/s -     10.682M
                  +=      1.786M (±13.2%) i/s -      8.804M
                push      1.930M (±16.1%) i/s -      9.472M
                 []=      1.948M (± 7.9%) i/s -      9.761M

Comparison:
                  <<:  2134005.4 i/s
                 []=:  1948256.8 i/s - 1.10x slower
                push:  1930165.3 i/s - 1.11x slower
                  +=:  1785808.5 i/s - 1.19x slower

[Finished in 28.3s]

Run Code Online (Sandbox Code Playgroud)

为什么<<比快+=？

Array#<<将元素附加到数组的四种方法中最快的是因为它只是这样 - 将一个元素附加到数组.相反,Array#+附加一个元素但返回一个新的数组副本 - 创建新的数组副本使其最慢.(可以使用toogle code文档中的选项来了解某些方法所做的其他工作)

基准标记 dup

如果我们使用下面的代码进行基准测试,

require 'benchmark/ips'

y = 10
Benchmark.ips do |x|
    x.report('<<')   { a = [0,1,2,3,4,5,6,7,8,9].dup; a << y }
    x.report('+=')   { a = [0,1,2,3,4,5,6,7,8,9].dup; a += [y] }
    x.report('push') { a = [0,1,2,3,4,5,6,7,8,9].dup; a.push(y) }
    x.report('[]=')  { a = [0,1,2,3,4,5,6,7,8,9].dup; a[a.size]=y }
    x.compare!
end

Run Code Online (Sandbox Code Playgroud)

我们看到以下结果:

Calculating -------------------------------------
                  <<    65.225k i/100ms
                  +=    76.106k i/100ms
                push    64.864k i/100ms
                 []=    63.582k i/100ms
-------------------------------------------------
                  <<      1.221M (±14.3%) i/s -      6.001M
                  +=      1.291M (±13.1%) i/s -      6.393M
                push      1.164M (±14.1%) i/s -      5.773M
                 []=      1.168M (±14.5%) i/s -      5.722M

Comparison:
                  +=:  1290970.6 i/s
                  <<:  1221029.0 i/s - 1.06x slower
                 []=:  1168219.3 i/s - 1.11x slower
                push:  1163965.9 i/s - 1.11x slower

[Finished in 28.3s]

Run Code Online (Sandbox Code Playgroud)

如果我们仔细研究两个结果,我们只看到一个区别.该+=条目已成为第一个,而其余方法的顺序与原始结果保持一致.

使用时为什么会翻转结果dup？

这是我疯狂的猜测,我猜测Ruby解释器优化了代码并且没有创建新数组作为其中的一部分,+=因为它知道它正在处理新创建的数组副本dup

令我惊讶的是,"<<"和"推"的结果是如此不同.我认为一个是另一个的别名. (3认同)
顺便说一句.这样的基准没有多大意义,因为一般规则没有推论.它们是OS/HW平台和语言实现依赖.在我的Linux x86_64系统上,`#<<`始终最快,##``最慢(~15%),CRuby 2.2.3.使用JRuby 9.0.1.0是最快的##] =`和`#+`slowest(~23%).使用`#dup`来创建数组而不是文字定义将`#+`移到顶部,尽管它产生更长的字节码(instr.序列)而没有明显的优化技巧.它可能是由底层的os或hw缓存管道引起的. (2认同)
问题的本质和它最有趣的部分是为什么重复翻转结果如此戏剧性,而不是哪个运算符是最快的. (2认同)

Answer 2

Fre*_*ung 2

我相信这取决于 MRI 如何分配数组（所有这些答案都是 MRI 特定的）。Ruby 非常努力地提高数组的效率：例如，小数组（<= 3 个元素）被直接打包到 RARRAY 结构中。

\n\n

另一件事是，如果您采用一个数组并开始一次附加一个值，则 ruby 不会一次增加一个元素，而是以块的形式增加缓冲区：这更有效，但会消耗少量的数据记忆。

\n\n

查看这一切的一个工具是使用 memsize_of：

\n\n

ObjectSpace.memspace_of([]) #=> 40 (on 64 bit platforms\nObjectSpace.memspace_of([1,2]) #=> 40 (on 64 bit platforms\nObjectSpace.memsize_of([1,2,3,4]) #=> 72\nObjectSpace.memsize_of([]<<1<<2<<3<<4) #=> 200\n

Run Code Online (Sandbox Code Playgroud)\n\n

在前 2 种情况下，数组打包在 RARRAY 结构中，因此内存大小只是任何对象的基本大小（40 字节）。在第三种情况下，Ruby 必须为 4 个值（每个值 8 个字节）分配一个数组，因此大小为 40 + 32 = 72。在最后一种情况下，Ruby 将存储空间增加到 20 个元素

\n\n

这与第二种情况有关。基准测试中的块有一个新创建的数组，该数组仍然有一些备用容量：

\n\n

 ObjectSpace.memsize_of((0..20).to_a) #=> 336, enough for nearly 40 elements.\n

Run Code Online (Sandbox Code Playgroud)\n\n

<<可以将其对象写入适当的槽，而+=必须分配一个新数组（对象及其缓冲区）并复制所有数据。

\n\n

如果我做

\n\n

a = [1,2,3,4,5]\nb  = a.dup\nObjectSpace.memsize_of(b) #=> 40\n

Run Code Online (Sandbox Code Playgroud)\n\n

这里b与共享其缓冲区a，因此报告为不使用超出基本对象大小的内存。在写入时b，Ruby 必须复制数据（写入时复制）：在第一个基准测试 +=中，两者<<实际上都分配了足够大小的新缓冲区并复制所有数据。

\n\n

这就是我感到困惑的地方：如果<<和+=表现相同，这将完全解释事情，但事实并非如此。我对事物的解读是+更简单的。它所要做的就是分配一个缓冲区，并从 2 个位置 memcpy 一些数据 - 这很快。

\n\n

<<另一方面是改变数组，因此它要支付写入时复制的开销：与+=. 例如，Ruby 需要跟踪谁在共享缓冲区，以便在没有人再共享原始数组时可以对原始数组进行垃圾回收。

\n\n

在某种程度上让我相信这种解释是正确的基准如下：

\n\n

require 'benchmark/ips'\nb = (0..20).to_a.dup\ny = 21\nBenchmark.ips do |x|\n  x.report('<<')   { a = b.dup; a << y }\n  x.report('+=')   { a = b.dup; a += [y] }\n\n  x.report('<<2')   { a = b.dup; a << y; a<< y}\n  x.report('+=2')   { a = b.dup; a += [y]; a += [y] }\nend\n

Run Code Online (Sandbox Code Playgroud)\n\n

这与原始基准基本相同，但现在附加了 2 个元素。对于<<写入时复制，只会在第一次时产生开销。我得到的结果是

\n\n

              <<      1.325M (\xc2\xb1 7.6%) i/s -      6.639M\n              +=      1.742M (\xc2\xb1 9.5%) i/s -      8.677M\n             <<2      1.230M (\xc2\xb110.3%) i/s -      6.079M\n             +=2      1.140M (\xc2\xb110.8%) i/s -      5.656M\n

Run Code Online (Sandbox Code Playgroud)\n\n

因此，如果您执行两次，则追加到数组就会回到顶部。

\n

归档时间：	10 年，2 月前
查看次数：	269 次
最近记录：	10 年，1 月前