熊猫相对时间枢轴

Mem*_*duh 5 python csv pivot dataframe pandas

我有八个月的客户数据,但这几个月不是同一个月,只是他们碰巧和我们在一起的最后几个月.每月费用和罚款存储在行中,但我希望过去八个月中的每一个都是一列.

是)我有的:

Customer Amount Penalties Month
123      500    200       1/7/2017
123      400    100       1/6/2017
   ...
213      300    150       1/4/2015
213      200    400       1/3/2015
Run Code Online (Sandbox Code Playgroud)

我想要的是:

Customer Month-8-Amount Month-7-Amount ... Month-1-Amount Month-1-Penalties ...
123      500            400                450            300
213      900            250                300            200
...
Run Code Online (Sandbox Code Playgroud)

我尝试过的:

df = df.pivot(index=num, columns=[amount,penalties])
Run Code Online (Sandbox Code Playgroud)

我收到了这个错误:

ValueError: all arrays must be same length
Run Code Online (Sandbox Code Playgroud)

有没有理想的方法来做到这一点?

WeN*_*Ben 4

unstack你可以用and来做set_index

# assuming all date is sort properly , then we do cumcount
df['Month']=df.groupby('Customer').cumcount()+1 

# slice the most recent 8 one 
df=df.loc[df.Month<=8,:]# slice the most recent 8 one 

# doing unstack to reshape your df 
s=df.set_index(['Customer','Month']).unstack().sort_index(level=1,axis=1)

# flatten multiple index to one 
s.columns=s.columns.map('{0[0]}-{0[1]}'.format) 
s.add_prefix("Month-")
Out[189]: 
          Month-Amount-1  Month-Penalties-1  Month-Amount-2  Month-Penalties-2
Customer                                                                      
123                  500                200             400                100
213                  300                150             200                400
Run Code Online (Sandbox Code Playgroud)