我有一个csv,它以我无法改变的格式生成.该文件具有多索引.该文件看起来像这样.
最终目标是将顶行(小时)转换为索引,并使用"ID"列对其进行索引,以使数据看起来像这样.
我已将文件导入熊猫...
myfile = 'c:/temp/myfile.csv'
df = pd.read_csv(myfile, header=[0, 1], tupleize_cols=True)
pd.set_option('display.multi_sparse', False)
df.columns = pd.MultiIndex.from_tuples(df.columns, names=['hour', 'field'])
df
Run Code Online (Sandbox Code Playgroud)
但这给了我三个未命名的字段:
我的最后一步是按小时堆叠:
df.stack(level=['hour'])
Run Code Online (Sandbox Code Playgroud)
但我错过了之前的内容,我可以在其中索引其他列,即使它们上方有一个空白的多索引线.