与蟒蛇大熊猫融化相反

Question

与蟒蛇大熊猫融化相反

Bor*_*lik 45 python pivot reshape melt pandas

我无法弄清楚如何在python中使用Pandas进行"反向融化".这是我的起始数据

import pandas as pd

from StringIO import StringIO

origin = pd.read_table(StringIO('''label    type    value
x   a   1
x   b   2
x   c   3
y   a   4
y   b   5
y   c   6
z   a   7
z   b   8
z   c   9'''))

origin
Out[5]: 
  label type  value
0     x    a      1
1     x    b      2
2     x    c      3
3     y    a      4
4     y    b      5
5     y    c      6
6     z    a      7
7     z    b      8
8     z    c      9

Run Code Online (Sandbox Code Playgroud)

这是我想要的输出:

    label   a   b   c
        x   1   2   3
        y   4   5   6
        z   7   8   9

Run Code Online (Sandbox Code Playgroud)

我确信有一种简单的方法可以做到这一点,但我不知道如何做到这一点.

Answer 1

beh*_*uri 62

有几种方法;
使用.pivot:

>>> origin.pivot(index='label', columns='type')['value']
type   a  b  c
label         
x      1  2  3
y      4  5  6
z      7  8  9

[3 rows x 3 columns]

Run Code Online (Sandbox Code Playgroud)

使用pivot_table:

>>> origin.pivot_table(values='value', index='label', columns='type')
       value      
type       a  b  c
label             
x          1  2  3
y          4  5  6
z          7  8  9

[3 rows x 3 columns]

Run Code Online (Sandbox Code Playgroud)

或者.groupby跟着.unstack:

>>> origin.groupby(['label', 'type'])['value'].aggregate('mean').unstack()
type   a  b  c
label         
x      1  2  3
y      4  5  6
z      7  8  9

[3 rows x 3 columns]

Run Code Online (Sandbox Code Playgroud)

以上哪一项是最普遍的？如果不是单个值列，而是有多个值列 - 通常会使用哪个列？（枢？） (2认同)

Answer 2

ans*_*sev 8

`DataFrame.set_index`+`DataFrame.unstack`

df.set_index(['label','type'])['value'].unstack()

type   a  b  c
label         
x      1  2  3
y      4  5  6
z      7  8  9

Run Code Online (Sandbox Code Playgroud)

简化主元参数的传递

df.pivot(*df)

type   a  b  c
label         
x      1  2  3
y      4  5  6
z      7  8  9

Run Code Online (Sandbox Code Playgroud)

[*df]
#['label', 'type', 'value']

Run Code Online (Sandbox Code Playgroud)

对于预期输出，我们需要DataFrame.reset_index和DataFrame.rename_axis

df.pivot(*df).rename_axis(columns = None).reset_index()

  label  a  b  c
0     x  1  2  3
1     y  4  5  6
2     z  7  8  9

Run Code Online (Sandbox Code Playgroud)

如果列中存在重复项，`a,b`我们可能会丢失信息，因此我们需要`GroupBy.cumcount`

print(df)

  label type  value
0     x    a      1
1     x    b      2
2     x    c      3
3     y    a      4
4     y    b      5
5     y    c      6
6     z    a      7
7     z    b      8
8     z    c      9
0     x    a      1
1     x    b      2
2     x    c      3
3     y    a      4
4     y    b      5
5     y    c      6
6     z    a      7
7     z    b      8
8     z    c      9

Run Code Online (Sandbox Code Playgroud)

df.pivot_table(index = ['label',
                        df.groupby(['label','type']).cumcount()],
               columns = 'type',
               values = 'value')


type     a  b  c
label           
x     0  1  2  3
      1  1  2  3
y     0  4  5  6
      1  4  5  6
z     0  7  8  9
      1  7  8  9

Run Code Online (Sandbox Code Playgroud)

或者：

(df.assign(type_2 = df.groupby(['label','type']).cumcount())
   .set_index(['label','type','type_2'])['value']
   .unstack('type'))

Run Code Online (Sandbox Code Playgroud)

归档时间：	11 年，11 月前
查看次数：	16630 次
最近记录：	7 年，8 月前

与蟒蛇大熊猫融化相反

DataFrame.set_index+DataFrame.unstack

如果列中存在重复项，a,b我们可能会丢失信息，因此我们需要GroupBy.cumcount

`DataFrame.set_index`+`DataFrame.unstack`

如果列中存在重复项，`a,b`我们可能会丢失信息，因此我们需要`GroupBy.cumcount`