sfo*_*ney 3 python dataframe pandas
如何将多个列组合成一个交错列?例如,如果我有数据:
Column 1 Column 2
0 A E
1 B F
2 C G
3 D H
Run Code Online (Sandbox Code Playgroud)
我想要它的形式:
Column 1
0 A
1 E
2 B
3 F
4 C
5 G
6 D
7 H
Run Code Online (Sandbox Code Playgroud)
什么是好的,矢量化的pythonic方式来做这个?我可能会做某种df.apply()hack,但我打赌有更好的方法.该应用程序将多个时间序列数据维度放入ML应用程序的单个流中.
首先堆叠列,然后删除多索引:
df.stack().reset_index(drop=True)
Out:
0 A
1 E
2 B
3 F
4 C
5 G
6 D
7 H
dtype: object
Run Code Online (Sandbox Code Playgroud)
要获取数据框:
pd.DataFrame(df.values.reshape(-1, 1), columns=['Column 1'])
Run Code Online (Sandbox Code Playgroud)
对于回答OP问题的系列:
pd.Series(df.values.flatten(), name='Column 1')
Run Code Online (Sandbox Code Playgroud)
对于一系列时序测试:
pd.Series(get_df(n).values.flatten(), name='Column 1')
Run Code Online (Sandbox Code Playgroud)
代码
def get_df(n=1):
df = pd.DataFrame({'Column 2': {0: 'E', 1: 'F', 2: 'G', 3: 'H'},
'Column 1': {0: 'A', 1: 'B', 2: 'C', 3: 'D'}})
return pd.concat([df for _ in range(n)])
Run Code Online (Sandbox Code Playgroud)
给定样本
给定样本 * 10,000
给定样本 * 1,000,000