Kri*_*lal 5 python-3.x pandas pandas-groupby
我想做的事groupby,shift而cumsum这似乎很琐碎的任务,但还是撞我的头在我得到的结果。有人可以告诉我我在做什么错。我在网上找到的所有结果都显示出我所做的相同或相同的变化。下面是我的实现。
temp = pd.DataFrame(data=[['a',1],['a',1],['a',1],['b',1],['b',1],['b',1],['c',1],['c',1]], columns=['ID','X'])
temp['transformed'] = temp.groupby('ID')['X'].cumsum().shift()
print(temp)
ID X transformed
0 a 1 NaN
1 a 1 1.0
2 a 1 2.0
3 b 1 3.0
4 b 1 1.0
5 b 1 2.0
6 c 1 3.0
7 c 1 1.0
Run Code Online (Sandbox Code Playgroud)
这是错误的,因为实际或我正在寻找的如下:
ID X transformed
0 a 1 NaN
1 a 1 1.0
2 a 1 2.0
3 b 1 NaN
4 b 1 1.0
5 b 1 2.0
6 c 1 NaN
7 c 1 1.0
Run Code Online (Sandbox Code Playgroud)
非常感谢。
你可以使用transform()养活那些在每个级别创建单独的组groupby成cumsum()和shift()方法。
temp['transformed'] = \
temp.groupby('ID')['X'].transform(lambda x: x.cumsum().shift())
Run Code Online (Sandbox Code Playgroud)
Run Code Online (Sandbox Code Playgroud)ID X transformed 0 a 1 NaN 1 a 1 1.0 2 a 1 2.0 3 b 1 NaN 4 b 1 1.0 5 b 1 2.0 6 c 1 NaN 7 c 1 1.0
有关更多信息,transform()请参阅此处:
| 归档时间: |
|
| 查看次数: |
485 次 |
| 最近记录: |