给定以下数据框:
pd.DataFrame({"A":[1,2,3],"B":[4,5,6],"C":[6,7,8]})
A B C
0 1 4 6
1 2 5 7
2 3 6 8
3 11 14 16
4 12 15 17
5 13 16 18
Run Code Online (Sandbox Code Playgroud)
我想重塑它,使其看起来像这样:
A B C A_1 B_1 C_1 A_2 B_2 C_2
0 1 4 6 2 5 7 3 6 8
1 11 14 16 12 15 17 13 16 18
Run Code Online (Sandbox Code Playgroud)
所以每 3 行被分组为 1 行
我怎样才能用熊猫实现这一目标?
jez*_*ael 11
一种想法是使用整数和模除法创建 MultiIndex 并通过DataFrame.unstack
以下方式重塑:
a = np.arange(len(df))
df.index = [a // 3, a % 3]
df = df.unstack().sort_index(axis=1, level=1)
df.columns = [f'{a}_{b}' for a, b in df.columns]
print (df)
A_0 B_0 C_0 A_1 B_1 C_1 A_2 B_2 C_2
0 1 4 6 2 5 7 3 6 8
1 11 14 16 12 15 17 13 16 18
Run Code Online (Sandbox Code Playgroud)
反向操作是可能的使用str.split
与DataFrame.stack
:
a = np.arange(len(df))
df1 = (df.set_index(pd.MultiIndex.from_arrays([a // 3, a % 3]))
.unstack().sort_index(axis=1, level=1))
df1.columns = [f'{a}_{b}' for a, b in df1.columns]
print (df1)
A_0 B_0 C_0 A_1 B_1 C_1 A_2 B_2 C_2
0 1 4 6 2 5 7 3 6 8
1 11 14 16 12 15 17 13 16 18
Run Code Online (Sandbox Code Playgroud)
df1.columns = df1.columns.str.split('_', expand=True)
df2 = df1.stack().reset_index(drop=True)
print (df2)
A B C
0 1 4 6
1 2 5 7
2 3 6 8
3 11 14 16
4 12 15 17
5 13 16 18
Run Code Online (Sandbox Code Playgroud)
war*_*ped 10
new = pd.concat([df[a::3].reset_index(drop=True) for a in range(3)], axis=1)
new.columns = ['{}_{}'.format(a,b) for b in range(3) for a in 'ABC']
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
224 次 |
最近记录: |