在pandas中设置多列索引

ale*_*oon 11 python numpy pandas

我像这样制作数据帧.

df = pd.DataFrame({
    'class' : ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
    'number' : [1,2,3,4,5,1,2,3,4,5],
    'math' : [90, 20, 50, 30, 57, 67, 89, 79, 45, 23],
    'english' : [40, 21, 68, 89, 90, 87, 89, 54, 21, 23]
})
Run Code Online (Sandbox Code Playgroud)

我想通过使用一些pandas方法将索引转换为此.(例如set_index,stack ,,,)

df1 = pd.DataFrame(np.random.randint(1, 100, (5, 4)),
             columns = [['A', 'A', 'B', 'B'],['english', 'math', 'english', 'math']],
             index = [1, 2, 3, 4, 5])
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点?

jez*_*ael 13

我认为你需要set_indexunstack重塑,然后交换在水平MultiIndex由列swaplevel由去年的排序列sort_index:

df1 = df.set_index(['number','class']).unstack().swaplevel(0,1,1).sort_index(1)

print (df1)
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23
Run Code Online (Sandbox Code Playgroud)

另一种解决方案:stackunstack:

print (df.set_index(['number','class']).stack().unstack([1,2]))
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23
Run Code Online (Sandbox Code Playgroud)


Rom*_*kar 5

我很喜欢@jezrael的答案,但是只是为了完整起见-您也可以使用+ pandas.DataFrame.pivot_table代替set_index+ unstack

>>> df.pivot_table(index='number', columns='class').swaplevel(axis=1).sort_index(1)
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23
Run Code Online (Sandbox Code Playgroud)