在Windows上创建缓慢的线程

Ins*_*oop 4 windows multithreading c++11

我已经使用C++ 11工具将数字运算应用程序升级为多线程程序.它在Mac OS X上运行良好,但不受益于Windows上的多线程(Visual Studio 2013).使用以下玩具程序

#include <iostream>
#include <thread>

void t1(int& k) {
    k += 1;
};

void t2(int& k) {
    k += 1;
};

int main(int argc, const char *argv[])
{
    int a{ 0 };
    int b{ 0 };

    auto start_time = std::chrono::high_resolution_clock::now();
    for (int i = 0; i < 10000; ++i) {
        std::thread thread1{ t1, std::ref(a) };
        std::thread thread2{ t2, std::ref(b) };
        thread1.join();
        thread2.join();
    }
    auto end_time = std::chrono::high_resolution_clock::now();
    auto time_stack = std::chrono::duration_cast<std::chrono::microseconds>(
        end_time - start_time).count();
    std::cout << "Time: " << time_stack / 10000.0 << " micro seconds" <<
        std::endl;

    std::cout << a << " " << b << std::endl;

    return 0;
}
Run Code Online (Sandbox Code Playgroud)

我发现在Mac OS X上启动一个线程需要34微秒,在Windows上需要340微秒才能完成相同的操作.我在Windows方面做错了吗?这是一个编译问题吗?

Dam*_*mon 7

不是编译器问题(严格来说也不是操作系统问题).

众所周知,创建线程是一项昂贵的操作.这是特别真实的Windows环境下(使用Linux下之前,是真实的clone为好).
此外,创建和加入一个线程必然很慢,并没有说明如何创建一个线程.加入假定线程已经退出,这只能在计划运行之后发生.因此,您的测量包括调度引入的延迟.就你所测量的时间而言,它实际上非常好(它们可以轻松地长20倍!).

然而,无论如何,产卵线程是否缓慢并不重要.

真实程序中创建20,000个基准测试中的线程是一个严重的错误.虽然创建数千(甚至数百万)个线程并非严格违法或不允许,但使用线程的"正确"方法是创建的线程数量不会超过大约CPU核心数量.一个人不会一直创建非常短暂的线程.
可能有一些短命的线程,并且您可能会创建一些额外的线程(例如阻塞I/O),但您不希望创建数百或数千个这样的线程.每个额外的线程(超出CPU核心数)意味着更多的上下文切换,更多的调度程序工作,更多的缓存压力,1MB的地址空间和每个线程64kB的物理内存(由于堆栈保留和提交粒度).

现在,假设您在程序启动时创建了10个线程,根本不需要花费3毫秒.无论如何,程序启动需要几百毫秒(至少),没有人会注意到差异.


Aja*_*jay 3

Visual C++ 使用并发运行时(MS 特定)来实现std.thread功能。当您直接调用任何并发运行时特性/函数时,它会创建一个默认的运行时对象(不详细介绍)。或者,当您调用std.thread函数时,它会执行与调用 ConcRT 函数相同的操作。

默认运行时(或者说调度程序)的创建需要一些时间,因此它似乎需要一些时间。尝试创建一个std::thread对象,让它运行;然后执行基准标记代码(例如上面的整个代码)。

编辑: