在Dask DataFrame中汇总分类数据

grz*_*ześ 8 python dask

默认情况下describe,Dask DataFrame的方法仅汇总数字列.根据文档,我应该能够通过提供include参数来获得分类列的描述.然而

df.describe(include=['category']).compute()

导致一个

TypeError: describe() got an unexpected keyword argument 'include'.

我也试过了一个不同的方法:

df.select_dtypes(include=['category']).describe().compute()

而这次我得到了

ValueError: DataFrame contains only non-numeric data.

您能否告诉我们在Dask DataFrame中总结分类列的最佳方法是什么?

小智 2

仅汇总数字或对象列

  1. 要仅对数字列调用describe(),请使用describe(include = [np.number])
  2. 使用describe(include = ['O'])仅对对象(字符串)调用describe()。

引用:Pandas 'describe' 没有返回所有列的摘要