我有一个pandas数据帧,有4行和4列 - 这里是简单的版本:
import pandas as pd
import numpy as np
rows = np.arange(1, 4, 1)
values = np.arange(1, 17).reshape(4,4)
df = pd.DataFrame(values, index=rows, columns=['A', 'B', 'C', 'D'])
Run Code Online (Sandbox Code Playgroud)
我想要做的是将其转换为2*8数据帧,每个数组都有B,C和D alligng - 所以它看起来像这样:
1 2
1 3
1 4
5 6
5 7
5 8
9 10
9 11
9 12
13 14
13 15
13 16
Run Code Online (Sandbox Code Playgroud)
阅读熊猫文档我试过这个:
df1 = pd.pivot_table(df, rows = ['B', 'C', 'D'], cols = 'A')
Run Code Online (Sandbox Code Playgroud)
但是给我一个错误,我无法确定来源(以...结尾)
DataError:无需聚合的数字类型
)
接下来我想基于A值拆分数据帧,但我认为.groupby命令可能会处理它
您正在寻找的是melt
功能
pd.melt(df,id_vars=['A'])
A variable value
0 1 B 2
1 5 B 6
2 9 B 10
3 13 B 14
4 1 C 3
5 5 C 7
6 9 C 11
7 13 C 15
8 1 D 4
9 5 D 8
10 9 D 12
11 13 D 16
Run Code Online (Sandbox Code Playgroud)
A
然后根据需要进行最终分类
pd.melt(df,id_vars=['A']).sort('A')
A variable value
0 1 B 2
4 1 C 3
8 1 D 4
1 5 B 6
5 5 C 7
9 5 D 8
2 9 B 10
6 9 C 11
10 9 D 12
3 13 B 14
7 13 C 15
11 13 D 16
Run Code Online (Sandbox Code Playgroud)
注意:pd.DataFrame.sort
已被弃用赞成pd.DataFrame.sort_values
.
归档时间: |
|
查看次数: |
4739 次 |
最近记录: |