我正在尝试重新排列熊猫数据框。
目前我有:
id mins param
1 10 0.15
1 11 0.16
1 12 0.17
2 10 0.20
2 11 0.21
2 12 0.22
Run Code Online (Sandbox Code Playgroud)
但我想重新排列并按ID分组:
id param_10 param_11 param_12
1 0.15 0.16 0.17
2 0.20 0.21 0.22
Run Code Online (Sandbox Code Playgroud)
在大熊猫中,有没有一种有效的方法?还是应该手动手动研磨所有东西?
谢谢
与last 一起使用pivot或:unstackset_indexadd_prefix
df = df.pivot(index='id', columns='mins', values='param').add_prefix('param_')
print (df)
mins param_10 param_11 param_12
id
1 0.15 0.16 0.17
2 0.20 0.21 0.22
Run Code Online (Sandbox Code Playgroud)
df = df.set_index(['id','mins'])['param'].unstack().add_prefix('param_')
print (df)
mins param_10 param_11 param_12
id
1 0.15 0.16 0.17
2 0.20 0.21 0.22
Run Code Online (Sandbox Code Playgroud)
如果错误:
ValueError:索引包含重复的条目,无法重塑
这意味着重复,需要汇总。使用pivot_table或groupby与像函数mean(sum,median,...)和最后unstack:
print (df)
id mins param
0 1 10 0.15 <- id mins dupe
1 1 10 0.50 <- id mins dupe
2 1 11 0.16
3 1 12 0.17
4 2 10 0.20
5 2 11 0.21
6 2 12 0.22
df = df.pivot_table(index='id', columns='mins', values='param', aggfunc='mean')
.add_prefix('param_')
print (df)
mins param_10 param_11 param_12
id
1 0.325 0.16 0.17 <- (0.15+0.5)/2 = 0.325
2 0.200 0.21 0.22
Run Code Online (Sandbox Code Playgroud)
df = df.groupby(['id','mins'])['param'].mean().unstack().add_prefix('param_')
print (df)
mins param_10 param_11 param_12
id
1 0.325 0.16 0.17 <- (0.15+0.5)/2 = 0.325
2 0.200 0.21 0.22
Run Code Online (Sandbox Code Playgroud)
对于清洁套装columns name,以None通过rename_axis和使用reset_index的列id:
df = df.rename_axis(None, axis=1).reset_index()
print (df)
id param_10 param_11 param_12
0 1 0.325 0.16 0.17
1 2 0.200 0.21 0.22
Run Code Online (Sandbox Code Playgroud)
编辑:
多列解决方案:
df['param1'] = df['param'] / 4
print (df)
id mins param param1
0 1 10 0.15 0.0375
1 1 10 0.50 0.1250
2 1 11 0.16 0.0400
3 1 12 0.17 0.0425
4 2 10 0.20 0.0500
5 2 11 0.21 0.0525
6 2 12 0.22 0.0550
df = df.pivot_table(index='id', columns='mins', values=['param', 'param1'], aggfunc='mean')
df.columns = ['_'.join((x[0], str(x[1]))) for x in df.columns]
print (df)
param_10 param_11 param_12 param1_10 param1_11 param1_12
id
1 0.325 0.16 0.17 0.08125 0.0400 0.0425
2 0.200 0.21 0.22 0.05000 0.0525 0.0550
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
287 次 |
| 最近记录: |