相关疑难解决方法(0)

Pandas DataFrame groupby 可变长度的重叠间隔

我正在尝试按 2 列对 DataFrame 进行分组(请参见下面的示例)。对于第一列,我希望每个值都属于一个组。对于第二列,我想按大小不等的重叠间隔进行分组。

我的理解是 pd.cut() 只允许我按不重叠的间隔进行分组。

这是一个例子:

    0   1   2
0   0   4   1721
1   0   5   2353
2   0   6   58
3   0   7   524
4   1   1   1934
5   1   2   1318
6   1   2   1307
7   1   2   301
8   1   2   502
9   1   3   996
10  1   3   32
Run Code Online (Sandbox Code Playgroud)

通过按第 0 列和第 1 列分组,我想要:

0  1    2
0 [4,5] [1721,2353]
  [5,6] [2353,58]
  [6,7] [58,524]
1 [1,2] [1934,1318,1307,301,502]
  [2,3] [1318,1307,301,502,996,32]
Run Code Online (Sandbox Code Playgroud)

然后我会取第 2 列的平均值或标准差。有什么建议吗?谢谢 !

python dataframe pandas

4
推荐指数
1
解决办法
2677
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1