基于索引的Pandas Dataframe Mask

Bra*_*AGr 5 python python-2.7 pandas

我有以下数据帧:

import pandas as pd
index = pd.date_range('2013-1-1',periods=10,freq='15Min')
data = pd.DataFrame(data=[1,2,3,4,5,6,7,8,9,0], columns=['value'], index=index)
Run Code Online (Sandbox Code Playgroud)

如何根据索引值生成掩码?我知道我可以这样做:

data['value'] > 3
Out[40]: 
2013-01-01 00:00:00    False
2013-01-01 00:15:00    False
2013-01-01 00:30:00    False
2013-01-01 00:45:00     True
2013-01-01 01:00:00     True
2013-01-01 01:15:00     True
2013-01-01 01:30:00     True
2013-01-01 01:45:00     True
2013-01-01 02:00:00     True
2013-01-01 02:15:00    False
Freq: 15T, Name: value, dtype: bool
Run Code Online (Sandbox Code Playgroud)

我想生成一个掩码,只考虑索引在一定范围内的某些行.我想做一些像data['index'].time() > datetime.time(1,15)生成面具的事情.当然,除非data['index']索引不是列的名称,否则会失败.如何引用掩码中行的索引值?

And*_*den 11

您可以使用indexer_between_time以下掩码:

In [11]: data.index.indexer_between_time(start='01:15', end='02:00')
Out[11]: array([5, 6, 7, 8])

In [12]: data.iloc[data.index.indexer_between_time(start='1:15', end='02:00')]
Out[12]:
                     value
2013-01-01 01:15:00      6
2013-01-01 01:30:00      7
2013-01-01 01:45:00      8
2013-01-01 02:00:00      9
Run Code Online (Sandbox Code Playgroud)

如您所见,您可以通过属性访问索引.index.

注意:indexer_between_time默认情况下都include_startinclude_end属实,这也提供了一个tz参数的时间来比较不同的时区.


Joh*_*eno 5

不建议使用'start'和'stop'关键字。熊猫> 17.1; 我不得不使用以下语法:

data.iloc[data.index.indexer_between_time('1:15', '02:00')]
Out[90]: 
                     value
2013-01-01 01:15:00      6
2013-01-01 01:30:00      7
2013-01-01 01:45:00      8
2013-01-01 02:00:00      9
Run Code Online (Sandbox Code Playgroud)