Bor*_*lik 45 python pivot reshape melt pandas
我无法弄清楚如何在python中使用Pandas进行"反向融化".这是我的起始数据
import pandas as pd
from StringIO import StringIO
origin = pd.read_table(StringIO('''label type value
x a 1
x b 2
x c 3
y a 4
y b 5
y c 6
z a 7
z b 8
z c 9'''))
origin
Out[5]:
label type value
0 x a 1
1 x b 2
2 x c 3
3 y a 4
4 y b 5
5 y c 6
6 z a 7
7 z b 8
8 z c 9
Run Code Online (Sandbox Code Playgroud)
这是我想要的输出:
label a b c
x 1 2 3
y 4 5 6
z 7 8 9
Run Code Online (Sandbox Code Playgroud)
我确信有一种简单的方法可以做到这一点,但我不知道如何做到这一点.
beh*_*uri 62
有几种方法;
使用.pivot
:
>>> origin.pivot(index='label', columns='type')['value']
type a b c
label
x 1 2 3
y 4 5 6
z 7 8 9
[3 rows x 3 columns]
Run Code Online (Sandbox Code Playgroud)
使用pivot_table
:
>>> origin.pivot_table(values='value', index='label', columns='type')
value
type a b c
label
x 1 2 3
y 4 5 6
z 7 8 9
[3 rows x 3 columns]
Run Code Online (Sandbox Code Playgroud)
>>> origin.groupby(['label', 'type'])['value'].aggregate('mean').unstack()
type a b c
label
x 1 2 3
y 4 5 6
z 7 8 9
[3 rows x 3 columns]
Run Code Online (Sandbox Code Playgroud)
DataFrame.set_index
+DataFrame.unstack
df.set_index(['label','type'])['value'].unstack()
type a b c
label
x 1 2 3
y 4 5 6
z 7 8 9
Run Code Online (Sandbox Code Playgroud)
简化主元参数的传递
df.pivot(*df)
type a b c
label
x 1 2 3
y 4 5 6
z 7 8 9
Run Code Online (Sandbox Code Playgroud)
[*df]
#['label', 'type', 'value']
Run Code Online (Sandbox Code Playgroud)
对于预期输出,我们需要DataFrame.reset_index
和DataFrame.rename_axis
df.pivot(*df).rename_axis(columns = None).reset_index()
label a b c
0 x 1 2 3
1 y 4 5 6
2 z 7 8 9
Run Code Online (Sandbox Code Playgroud)
a,b
我们可能会丢失信息,因此我们需要GroupBy.cumcount
print(df)
label type value
0 x a 1
1 x b 2
2 x c 3
3 y a 4
4 y b 5
5 y c 6
6 z a 7
7 z b 8
8 z c 9
0 x a 1
1 x b 2
2 x c 3
3 y a 4
4 y b 5
5 y c 6
6 z a 7
7 z b 8
8 z c 9
Run Code Online (Sandbox Code Playgroud)
df.pivot_table(index = ['label',
df.groupby(['label','type']).cumcount()],
columns = 'type',
values = 'value')
type a b c
label
x 0 1 2 3
1 1 2 3
y 0 4 5 6
1 4 5 6
z 0 7 8 9
1 7 8 9
Run Code Online (Sandbox Code Playgroud)
或者:
(df.assign(type_2 = df.groupby(['label','type']).cumcount())
.set_index(['label','type','type_2'])['value']
.unstack('type'))
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
16630 次 |
最近记录: |