我有一个熊猫数据框,如:
Date, Amount
01/01/2020, 10
01/02/2020, 15
01/03/2020, 0
01/04/2020, 11
01/05/2020, 0
01/06/2020, 15
01/07/2020, 12
...
Run Code Online (Sandbox Code Playgroud)
我想添加一个新列(即“之前”),显示自上次 0 金额以来的天数。例如
Date, Amount, Before
01/01/2020, 10, 0
01/02/2020, 15, 0
01/03/2020, 0, 0
01/04/2020, 11, 1
01/05/2020, 0, 0
01/06/2020, 15, 1
01/07/2020, 12, 2
...
Run Code Online (Sandbox Code Playgroud)
有任何想法吗?
先感谢您
您可以创建帮手系列的比较Amount通过0用连续的总和Series.cumsum,滤出第一组和创建first的系列0每行分组GroupBy.transform和GroupBy.first,然后减去天从以前的天数0:
df['Date'] = pd.to_datetime(df['Date'])
g = df['Amount'].eq(0).cumsum()
first = df.groupby(g[g > 0])['Date'].transform('first')
df['Before'] = df['Date'].sub(first).dt.days.fillna(0).astype(int)
print (df)
Date Amount Before
0 2020-01-01 10 0
1 2020-01-02 15 0
2 2020-01-03 0 0
3 2020-01-04 11 1
4 2020-01-05 0 0
5 2020-01-06 15 1
6 2020-01-07 12 2
Run Code Online (Sandbox Code Playgroud)