替换 dask 数据框分区

Dhr*_*mar 2 dask

我可以将 dask 数据帧分区替换为我单独创建的另一个具有相同行数和相同结构的 dask 数据帧分区吗?如果是,怎么办?

是否可以使用不同的行数?

MRo*_*lin 5

您可以使用该函数将分区添加到 Dask 数据帧的开头或结尾dd.concat

您可以通过切换到延迟对象,将延迟对象插入到列表中,然后切换回 dask 数据帧,在数据帧中的任何位置插入新分区

list_of_delayed = dask_df.to_delayed()
new_partition = dask.delayed(pd.read_csv)(filename)
list_of_delayed[i] = new_partition
new_dask_df = dd.from_delayed(list_of_delayed, meta=dask_df._meta)
Run Code Online (Sandbox Code Playgroud)

它可以具有不同的行数,但必须具有相同的列和数据类型