关于黄昏。
我想将 parquet 文件读取为 df 并运行 groupby 函数
我的问题是为什么我应该先运行这段代码?
from dask.distributed import Client, progress
client = Client()
client
Run Code Online (Sandbox Code Playgroud)
不仅仅是
import dask.dataframe as dd
df = dd.read_parquet(r'C:\Users\ggg\mis_1.parquet')
g=df.groupby('id')['id'].count().compute()
Run Code Online (Sandbox Code Playgroud)
对我来说,没有客户它效果更好