Elixir中BitString的位计数或汉明重量?

Cha*_*gwu 4 elixir bitstring hammingweight

请问我们如何efficiently计算酏剂中汉字的重量?

示例:0b0101101001汉明权重为5(即设置为5位)

我的尝试:

iex> Enum.count(Integer.to_char_list(n,2),&(&1===49)) 
Run Code Online (Sandbox Code Playgroud)

Pat*_*ity 6

这是一个性能更好的解决方案,(对我而言)也更清楚地表明了意图:

for(<<bit::1 <- :binary.encode_unsigned(n)>>, do: bit) |> Enum.sum
Run Code Online (Sandbox Code Playgroud)

使用具有100.000二进制数字的benchfella进行基准测试:

Benchfella.start

defmodule HammingBench do
  use Benchfella

  @n Stream.repeatedly(fn -> Enum.random [0, 1] end)
    |> Enum.take(100_000)
    |> Enum.join
    |> String.to_integer(2)

  bench "CharlesO" do
    Enum.count(Integer.to_char_list(@n,2),&(&1===49)) 
  end

  bench "Patrick Oscity" do
    for(<<bit::1 <- :binary.encode_unsigned(@n)>>, do: bit) |> Enum.sum
  end
end
Run Code Online (Sandbox Code Playgroud)

基准测试结果:

$ mix bench
Compiled lib/hamming_bench.ex
Generated hamming_bench app
Settings:
  duration:      1.0 s

## HammingBench
[20:12:03] 1/2: Patrick Oscity
[20:12:06] 2/2: CharlesO

Finished in 8.4 seconds

## HammingBench
Patrick Oscity         500   4325.79 µs/op
CharlesO                 1   5754094.00 µs/op
Run Code Online (Sandbox Code Playgroud)

  • 实现的最慢部分是将整数转换为字符列表。另一方面,二进制模式匹配是高度优化的。但是,对于少量数字,性能差异可以忽略不计。 (2认同)
  • Protip:如果你把代码放在`bench/hamming_bench.exs`文件中,你不需要手动调用`Benchfella.start`. (2认同)
  • 对于所有希望了解加速原因的读者,请访问https://groups.google.com/forum/?utm_medium=email&amp;utm_source=footer#!msg/elixir-lang-talk/uKkM0XMDAC0/culTFWF-AgAJ (2认同)