您可以使用该函数将分区添加到 Dask 数据帧的开头或结尾dd.concat。
您可以通过切换到延迟对象,将延迟对象插入到列表中,然后切换回 dask 数据帧,在数据帧中的任何位置插入新分区
list_of_delayed = dask_df.to_delayed()
new_partition = dask.delayed(pd.read_csv)(filename)
list_of_delayed[i] = new_partition
new_dask_df = dd.from_delayed(list_of_delayed, meta=dask_df._meta)
Run Code Online (Sandbox Code Playgroud)
它可以具有不同的行数,但必须具有相同的列和数据类型
| 归档时间: |
|
| 查看次数: |
360 次 |
| 最近记录: |