假设我有以下内容:
In [1]: import pandas as pd
import numpy as np
df = pd.DataFrame(data=np.random.rand(11),index=pd.date_range('2015-04-20','2015-04-30'),columns=['A'])
Out[1]:
A
2015-04-20 0.694983
2015-04-21 0.393851
2015-04-22 0.690138
2015-04-23 0.674222
2015-04-24 0.763175
2015-04-25 0.761917
2015-04-26 0.999274
2015-04-27 0.907871
2015-04-28 0.464818
2015-04-29 0.005733
2015-04-30 0.806351
Run Code Online (Sandbox Code Playgroud)
我有一些复杂的方法可以将单个索引标识为有趣,例如'2015-04-25'.我可以使用以下命令检索具有该索引的行:
In [2]: df.loc['2015-04-25']
Out[2]:
A 0.761917
Name: 2015-04-25 00:00:00, dtype: float64
Run Code Online (Sandbox Code Playgroud)
在索引值之前和/或之后获取n行的最佳方法是什么?
我想做的是:
In[3]: df.getRowsBeforeLoc('2015-04-25',3)
Out[3]:
2015-04-22 0.690138
2015-04-23 0.674222
2015-04-24 0.763175
2015-04-25 0.761917
Run Code Online (Sandbox Code Playgroud)
或等效地:
In[3]: df.getRowsAfterLoc('2015-04-25',3)
Out[3]:
2015-04-25 0.761917
2015-04-26 0.999274
2015-04-27 0.907871
2015-04-28 0.464818
Run Code Online (Sandbox Code Playgroud)
(我对是否包含与目标索引值本身对应的行没有强烈的意见.)
EdC*_*ica 22
loc 支持切片的beg/end点包含在范围内:
In [363]:
df.loc[:'2015-04-25']
Out[363]:
A
2015-04-25 0.141787
2015-04-26 0.598237
2015-04-27 0.106461
2015-04-28 0.297159
2015-04-29 0.058392
2015-04-30 0.621325
In [364]:
df.loc['2015-04-25':]
Out[364]:
A
2015-04-25 0.141787
2015-04-26 0.598237
2015-04-27 0.106461
2015-04-28 0.297159
2015-04-29 0.058392
2015-04-30 0.621325
Run Code Online (Sandbox Code Playgroud)
要获得第一个/最后一个(n)行,请使用head/ tail:
In [378]:
df.loc[:'2015-04-25'].head(3)
Out[378]:
A
2015-04-20 0.827699
2015-04-21 0.901140
2015-04-22 0.427304
In [377]:
df.loc[:'2015-04-25'].tail(3)
Out[377]:
A
2015-04-23 0.002189
2015-04-24 0.041965
2015-04-25 0.141787
Run Code Online (Sandbox Code Playgroud)
更新
要获取特定值之前/之后的行,我们可以get_loc在索引上使用它来返回整数位置,然后使用它iloc来获取上一行/下一行:
In [388]:
df.index.get_loc('2015-04-25')
Out[388]:
5
In [391]:
df.iloc[df.index.get_loc('2015-04-25')-1]
Out[391]:
A 0.041965
Name: 2015-04-24 00:00:00, dtype: float64
In [392]:
df.iloc[df.index.get_loc('2015-04-25')+1]
Out[392]:
A 0.598237
Name: 2015-04-26 00:00:00, dtype: float64
Run Code Online (Sandbox Code Playgroud)