小编Sir*_*man的帖子

只对Pandas中的一些列进行多索引

我有一个csv,它以我无法改变的格式生成.该文件具有多索引.该文件看起来像这样.

在此输入图像描述

最终目标是将顶行(小时)转换为索引,并使用"ID"列对其进行索引,以使数据看起来像这样.

在此输入图像描述

我已将文件导入熊猫...

myfile = 'c:/temp/myfile.csv'
df = pd.read_csv(myfile, header=[0, 1], tupleize_cols=True)
pd.set_option('display.multi_sparse', False)
df.columns = pd.MultiIndex.from_tuples(df.columns, names=['hour', 'field'])
df
Run Code Online (Sandbox Code Playgroud)

但这给了我三个未命名的字段:

在此输入图像描述

我的最后一步是按小时堆叠:

df.stack(level=['hour'])
Run Code Online (Sandbox Code Playgroud)

但我错过了之前的内容,我可以在其中索引其他列,即使它们上方有一个空白的多索引线.

python multi-index dataframe pandas

5
推荐指数
1
解决办法
862
查看次数

标签 统计

dataframe ×1

multi-index ×1

pandas ×1

python ×1