熊猫:按移动量和累计总和

Kri*_*lal 5 python-3.x pandas pandas-groupby

我想做的事groupbyshiftcumsum这似乎很琐碎的任务,但还是撞我的头在我得到的结果。有人可以告诉我我在做什么错。我在网上找到的所有结果都显示出我所做的相同或相同的变化。下面是我的实现。

temp = pd.DataFrame(data=[['a',1],['a',1],['a',1],['b',1],['b',1],['b',1],['c',1],['c',1]], columns=['ID','X'])

temp['transformed'] = temp.groupby('ID')['X'].cumsum().shift()
print(temp)

   ID   X   transformed
0   a   1   NaN
1   a   1   1.0
2   a   1   2.0
3   b   1   3.0
4   b   1   1.0
5   b   1   2.0
6   c   1   3.0
7   c   1   1.0
Run Code Online (Sandbox Code Playgroud)

这是错误的,因为实际或我正在寻找的如下:

   ID   X   transformed
0   a   1   NaN
1   a   1   1.0
2   a   1   2.0
3   b   1   NaN
4   b   1   1.0
5   b   1   2.0
6   c   1   NaN
7   c   1   1.0
Run Code Online (Sandbox Code Playgroud)

非常感谢。

lee*_*sej 8

你可以使用transform()养活那些在每个级别创建单独的组groupbycumsum()shift()方法。

temp['transformed'] = \
    temp.groupby('ID')['X'].transform(lambda x: x.cumsum().shift())
Run Code Online (Sandbox Code Playgroud)
  ID  X   transformed
0  a  1   NaN
1  a  1   1.0
2  a  1   2.0
3  b  1   NaN
4  b  1   1.0
5  b  1   2.0
6  c  1   NaN
7  c  1   1.0
Run Code Online (Sandbox Code Playgroud)

有关更多信息,transform()请参阅此处: