Dask Dataframe groupby 没有 len()

Bac*_*ics 5 python dataframe dask

如果您有一个基于 dask 数据帧的 groupby 对象,为什么会len(<groupby object>)返回错误?(错误或功能)

MRo*_*lin 3

这只是尚未实施。您可能想提出一个问题(或者更好的是,提出拉取请求)。务实地说,我只会调用nunique你的分组对象

g = df.groupby(df.x + df.y)
result = len(g)
Run Code Online (Sandbox Code Playgroud)

result = (df.x + df.y).nunique()
Run Code Online (Sandbox Code Playgroud)

从操作上来说,这更好,因为它可以是惰性的(Python 中的结果len必须是具体的整数),并且因为您可以选择nunique_approx变体,这会快得多。