使用Dask数据框删除列

cs0*_*815 3 python python-3.x pandas dask

这应该工作:

raw_data.drop('some_great_column', axis=1).compute(

但是该列未删除。在大熊猫中,我使用:

raw_data.drop(['some_great_column'], axis=1, inplace=True)
Run Code Online (Sandbox Code Playgroud)

但是就地在Dask中不存在。有任何想法吗?

jpp*_*jpp 6

您可以分为两个操作:

# dask operation
raw_data = raw_data.drop('some_great_column', axis=1)

# conversion to pandas
df = raw_data.compute()
Run Code Online (Sandbox Code Playgroud)

然后将Pandas数据框导出到CSV文件:

df.to_csv(r'out.csv', index=False)
Run Code Online (Sandbox Code Playgroud)

  • 我猜由于内存问题,向 Pandas 的转换可能会失败……我开始使用 Dask 的原因…… (2认同)