我正在使用基本上是时间序列的pandas数据帧,如下所示:
level
Date
1976-01-01 409.67
1976-02-01 409.58
1976-03-01 409.66
…
Run Code Online (Sandbox Code Playgroud)
我想要的是,level列的多个索引/标题,如下所示:
Station1 #Name of the datasource
43.1977317,-4.6473648,5 #Lat/Lon of the source
Precip #Type of data
Date
1976-01-01 409.67
1976-02-01 409.58
1976-03-01 409.66
…
Run Code Online (Sandbox Code Playgroud)
所以基本上我正在寻找类似的东西Mydata.columns.level1 = ['Station1'],Mydata.columns.level2 = [Lat,Lon],Mydata.columns.level3 = ['Precip'].
原因是单个位置可以有多个数据集,并且我希望能够从后续合并的大数据帧中从一个位置选择所有数据,或者从所有位置选择特定类型的所有数据.
我可以从pandas文档中设置一个示例数据框,并测试我的选择,但是对于我的实际数据,我需要一种不同的方式来设置索引,如示例中所示.
例:
建立了一个小型数据帧
header = [np.array(['location','location','location','location2','location2','location2']),
np.array(['S1','S2','S3','S1','S2','S3'])]
df = pd.DataFrame(np.random.randn(5, 6), index=['a','b','c','d','e'], columns = header )
df
location location2
S1 S2 S3 S1 S2 S3
a -1.469932 -1.544511 -1.373463 -0.317262 0.024832 -0.641000
b …Run Code Online (Sandbox Code Playgroud)