pandas - 根据“下一个”行值创建新列

Jes*_*roe 3 python dataframe pandas

我有以下数据框:

   date      country   
   6/1/18    USA
   6/1/18    BEL
   6/4/18    USA
   6/5/18    BEL
   6/6/18    USA
Run Code Online (Sandbox Code Playgroud)

我想创建一个列,告诉您相应国家/地区的下一个日期是什么。如果有帮助,您可以假设日期是有序的。如果该日期是该国家/地区的最后一个日期,您可以使用相同的日期或空值填写下一个日期。

   date      country   next_date
   6/1/18    USA       6/4/18
   6/1/18    BEL       6/5/18
   6/4/18    USA       6/6/18
   6/5/18    BEL       6/5/18
   6/6/18    USA       6/6/18
Run Code Online (Sandbox Code Playgroud)

use*_*203 6

您可以使用groupbyshift填写下一个可用值,但是,这将使没有下一个可用日期的行变为NaN

df.assign(ndate=df.groupby('country').date.shift(-1))
Run Code Online (Sandbox Code Playgroud)

     date country   ndate
0  6/1/18     USA  6/4/18
1  6/1/18     BEL  6/5/18
2  6/4/18     USA  6/6/18
3  6/5/18     BEL     NaN
4  6/6/18     USA     NaN
Run Code Online (Sandbox Code Playgroud)

如果您想用上次看到的日期填写这些值,您可以简单地fillna使用您的date列:

df.assign(ndate=df.groupby('country').date.shift(-1)).fillna({'ndate': df.date})
Run Code Online (Sandbox Code Playgroud)

     date country   ndate
0  6/1/18     USA  6/4/18
1  6/1/18     BEL  6/5/18
2  6/4/18     USA  6/6/18
3  6/5/18     BEL  6/5/18
4  6/6/18     USA  6/6/18
Run Code Online (Sandbox Code Playgroud)