std :: mt19937_64比std :: mt19937更快吗?

Chr*_*s P 3 c++ random

假设64位架构,是否mt19937_64具有比32位版本更高的吞吐量(bit/s)mt19937

矢量化之后怎么样?

小智 6

它显然取决于您的编译器及其实现.我刚刚测试过,64位版本的呼叫呼叫时间长了大约60%,这使得64位版本的比特速度提高了约25%.我用i7 cpu测试过.

如果您需要最高速度,您可能需要考虑使用其他东西.特别是如果数字不需要非常高的质量.


Jer*_*fin 6

正如@byjoe 指出的那样,这显然取决于编译器。

在这种情况下,它似乎比典型情况依赖于编译器。例如,评论中链接的 Boost 测试使用了 VC++ 2010 的编译器,并且与使用 mt19937_64 相比,每秒随机位仅略有增加。

为了获得更多最新信息,我进行了一个简单的测试:

#include <random>
#include <chrono>
#include <iostream>
#include <iomanip>

template <class T, class U>
U test(char const *label, U count) {
    using namespace std::chrono;
    T gen(100);

    U result = 0;

    auto start = high_resolution_clock::now();
    for (U i = 0; i < count; i++)
        result ^= gen();
    auto stop = high_resolution_clock::now();
    std::cout << "Time for " << std::left << std::setw(12) << label
        << duration_cast<milliseconds>(stop - start).count() << "\n";
    return result;
}

int main(int argc, char **argv) {
    unsigned long long limit = 1000000000;

    auto result1 = test<std::mt19937>("mt19937: ", limit);
    auto result2 = test<std::mt19937_64>("mt19937_64: ", limit);

    std::cout << "Ignore: " << result1 << ", " << result2 << "\n";
}
Run Code Online (Sandbox Code Playgroud)

使用 VC++ 2015 udpate 3(使用 /o2b2 /GL,虽然可能无关紧要),我得到了如下结果:

Time for mt19937:    4339
Time for mt19937_64: 4215
Ignore: 2598366015, 13977046647333287932
Run Code Online (Sandbox Code Playgroud)

这表明 mt19937_64 每次调用的速度略快,因此每比特的速度是 mt19937 的两倍多。使用 MinGW(使用 -O3),结果更像是从 Boost 站点链接的结果:

Time for mt19937:    2211
Time for mt19937_64: 4183
Ignore: 2598366015, 13977046647333287932
Run Code Online (Sandbox Code Playgroud)

在这种情况下,mt19937_64 每次调用所用的时间不到两倍,因此每比特只稍微快一点。最高的整体速度似乎来自带有 mt19937_64 的 g++,但 g++ 和 VC++(在这些运行中)之间的差异小于 1%,所以我不确定它是否可重现。

就其价值而言,使用 VC++ 的 mt19937 和 mt19937_64 之间的速度差异(每次调用)也非常小,但似乎是可重现的——它在我的测试中一直发生。我确实想知道这是否可能(至少部分)是时钟管理的问题——当代码第一次启动时,CPU 空闲,时钟变慢,所以第一次运行的第一部分是在较低的时钟速度。为了检查,我颠倒了顺序来首先测试 mt19937_64。我认为我的假设至少部分正确——当我颠倒顺序时,mt19937_64 与 mt19937 相比变慢了,所以它们在每次调用的基础上与 VC++ 几乎相同。