Kotlin 协程比线程花费的时间更长

Ser*_*hyr 3 concurrency coroutine kotlin kotlin-coroutines

我是 Kotlin 和协程的新手,我正在尝试了解协程 API,所以我很可能做错了什么。所以我有某种对象的列表,我试图对这些对象中的每一个应用一些长时间运行的处理。

val listOfFoos = listOf(Foo(1), ..., Foo(n))
listOfFoos.forEach { longRunningJob(it) }

fun longRunningJob(foo: Foo) {
    runBlocking{
        delay(2000) //hardcoded delay for testing
    }
    //do something else
}
Run Code Online (Sandbox Code Playgroud)

当然,这是并发运行它的完美候选者,所以这里使用的是好的旧线程:

listOfFoos.map { thread(start = true) { longRunningJob(it) } }.forEach { it.join() }
Run Code Online (Sandbox Code Playgroud)

当我测量它的执行时间时,它measureTimeMillis给了我大约 2 秒的时间,这看起来非常好,因为每个都longRunningJob并行运行。但是协程要好得多,因为它没有用于上下文切换的线程那样的开销。所以这是我使用协程的实现:

val deferredResults =
    listOfFoos.map { GlobalScope.async { longRunningJob(it) } }
runBlocking {
    deferredResults.awaitAll()
}
Run Code Online (Sandbox Code Playgroud)

但是这个实现在大约 4 秒内完成了执行,这根本不是我所期望的,如果我向列表中添加更多元素,执行时间也会增加。

那么我在这里做错了什么?

s1m*_*nw1 6

执行此代码所需的时间取决于用于计算的线程数。您的线程示例没有定义边界,并且会产生与您有作业一样多的线程。另一方面,协程示例GlobalScope将内部使用Dispatchers.Default线程池的所有任务分派到。这个池是有限的:

如果在上下文中没有指定调度程序或任何其他 ContinuationInterceptor,则所有标准构建器(如启动、异步等)使用的默认 CoroutineDispatcher。

它由 JVM 上的共享线程池提供支持。默认情况下,此调度程序使用的最大线程数等于 CPU 内核数,但至少为两个。

假设您有 4 个内核。使用 4 个作业运行代码将导致大约 2 秒的运行时间,因为一切都是并行运行的(注意并发 <> 并行)。但是,一旦您有超过 4 个任务,就必须等到第一个任务中的一个完成,因为在任何时候只有 4 个任务可以同时运行。

您可以将调度程序池更改为具有更多线程的调度程序池:

GlobalScope.async(Dispatchers.IO)
Run Code Online (Sandbox Code Playgroud)

请注意,这delay是长时间运行任务的一个不好的例子。它不会阻塞调用者线程,因为它是一个真正的挂起函数,只会暂停协程。您实际上可以main完全运行您的代码:

runBlocking {
    val deferredResults =
        (0..10).map { async(Dispatchers.IO) { longRunningJob() } }
    deferredResults.awaitAll()
}
Run Code Online (Sandbox Code Playgroud)