有没有办法限制默认线程调度程序使用的内核数(使用dask数据帧时默认)?
使用compute,您可以使用以下命令指定它:
df.compute(get=dask.threaded.get, num_workers=20)
Run Code Online (Sandbox Code Playgroud)
但我想知道是否有办法将其设置为默认值,因此您不需要为每次compute调用指定此项?
例如,在小型集群(例如64个核心)的情况下会很有趣,但是与其他人共享(没有作业系统),并且我不希望在使用dask开始计算时占用所有核心.
MRo*_*lin 14
您可以指定默认的ThreadPool
from multiprocessing.pool import ThreadPool
import dask
dask.config.set(pool=ThreadPool(20))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3397 次 |
| 最近记录: |