Bac*_*ics 5 python dataframe dask
如果您有一个基于 dask 数据帧的 groupby 对象,为什么会len(<groupby object>)返回错误?(错误或功能)
这只是尚未实施。您可能想提出一个问题(或者更好的是,提出拉取请求)。务实地说,我只会调用nunique你的分组对象
g = df.groupby(df.x + df.y)
result = len(g)
Run Code Online (Sandbox Code Playgroud)
result = (df.x + df.y).nunique()
Run Code Online (Sandbox Code Playgroud)
从操作上来说,这更好,因为它可以是惰性的(Python 中的结果len必须是具体的整数),并且因为您可以选择nunique_approx变体,这会快得多。
| 归档时间: |
|
| 查看次数: |
343 次 |
| 最近记录: |