异步函数以同步(串行)方式运行,任务相互阻塞

Mah*_*chi 1 python python-asyncio

我使用 asyncio 没有获得任何加速。此代码片段仍然以与同步作业相同的方式运行。大多数示例使用 asyncio.sleep() 来施加延迟,我的问题是如果部分代码根据输入参数造成延迟怎么办?

async def c(n):
    #this loop is supposed to impose delay
    for i in range(1, n * 40000):
        c *= i
   return n

async def f():
    tasks = [c(i) for i in [2,1,3]]
    r=[]
    completed, pending = await asyncio.wait(tasks)
    for item in completed:
        r.append(item.result())

    return r

if __name__=="__main__":
    loop = asyncio.get_event_loop()
    k=loop.run_until_complete(f())
    loop.close()
Run Code Online (Sandbox Code Playgroud)

我期望得到 [1,2,3] 但我没有(串行运行时也没有时间差)

use*_*342 5

asyncio 并不是为了获得加速,而是为了在异步环境中编程时避免“回调地狱”,例如(但不限于)非阻塞 IO。由于问题中的代码不是异步的,因此使用 asyncio 没有任何好处 - 但您可以multiprocessing改为查看。

在上面的情况下,该函数被定义为异步,但它运行整个计算而不等待任何东西。它还包含对未分配变量的引用,因此让我们从运行的版本开始:

async def long_calc(n):
    p = 1
    for i in range(1, n * 10000):
        p *= i
    print(math.log(p))
    return p
Run Code Online (Sandbox Code Playgroud)

末尾的print立即指示计算何时完成。“并行”启动几个这样的协程是通过以下方式完成的asyncio.gather

async def wait_calcs():
    return await asyncio.gather(*[long_calc(i) for i in [2, 1, 3]])
Run Code Online (Sandbox Code Playgroud)

asyncio.gather将使计算运行并在所有计算完成后返回,按照它们在参数列表中出现的顺序返回结果列表。但运行时打印的输出loop.run_until_complete(wait_calcs())显示计算并未真正并行运行:

178065.71824964616
82099.71749644238
279264.3442843094
Run Code Online (Sandbox Code Playgroud)

结果与[2, 1, 3]顺序相对应。如果协程并行运行,则最小的数字将首先出现,因为它的协程迄今为止要做的工作最少。

我们可以通过在内循环中引入空操作睡眠来强制协程给其他协程运行的机会:

async def long_calc(n):
    p = 1
    for i in range(1, n * 10000):
        p *= i
        await asyncio.sleep(0)
    print(math.log(p))
    return p
Run Code Online (Sandbox Code Playgroud)

现在的输出显示协程正在并行运行:

82099.71749644238
178065.71824964616
279264.3442843094
Run Code Online (Sandbox Code Playgroud)

请注意,此版本还需要更多时间来运行,因为它涉及协程和主循环之间的更多切换。可以通过大约一百个周期只睡眠一次来避免速度减慢。