如何基于日期时间索引切片Pandas Dataframe

000*_*000 12 python slice pandas

多年来,这一直困扰着我:

给定一个简单的熊猫DataFrame

>>> df

Timestamp     Col1
2008-08-01    0.001373
2008-09-01    0.040192
2008-10-01    0.027794
2008-11-01    0.012590
2008-12-01    0.026394
2009-01-01    0.008564
2009-02-01    0.007714
2009-03-01   -0.019727
2009-04-01    0.008888
2009-05-01    0.039801
2009-06-01    0.010042
2009-07-01    0.020971
2009-08-01    0.011926
2009-09-01    0.024998
2009-10-01    0.005213
2009-11-01    0.016804
2009-12-01    0.020724
2010-01-01    0.006322
2010-02-01    0.008971
2010-03-01    0.003911
2010-04-01    0.013928
2010-05-01    0.004640
2010-06-01    0.000744
2010-07-01    0.004697
2010-08-01    0.002553
2010-09-01    0.002770
2010-10-01    0.002834
2010-11-01    0.002157
2010-12-01    0.001034
Run Code Online (Sandbox Code Playgroud)

如何分隔它,以便新的DataFrame等于df中介于2009-05-01和之间的日期的条目2010-03-01

>>> df2

Timestamp     Col1
2009-05-01    0.039801
2009-06-01    0.010042
2009-07-01    0.020971
2009-08-01    0.011926
2009-09-01    0.024998
2009-10-01    0.005213
2009-11-01    0.016804
2009-12-01    0.020724
2010-01-01    0.006322
2010-02-01    0.008971
2010-03-01    0.003911
Run Code Online (Sandbox Code Playgroud)

use*_*128 15

如果已将“时间戳”列设置为索引,则可以简单地使用

df['2009-05-01' :'2010-03-01']
Run Code Online (Sandbox Code Playgroud)

  • 此外。如果您的索引中还有时间,则可以像这样使用它`df.loc['2009-05-01 00:00:00':'2009-03-01 23:00:00']`。 (5认同)
  • 另外,如果您只需要一个日期,您可以执行 `df.loc['2009-05-01']` :) (2认同)
  • 当且仅当您已排序索引并且间隔列之间没有其他不相关的列时,此方法才有效 (2认同)

raf*_*elc 5

IIUC,简单切片?

from datetime import datetime
df2 = df[(df.Timestamp >= datetime(2009, 05, 01)) &
         (df.Timestamp <= datetime(2010, 03, 01))]
Run Code Online (Sandbox Code Playgroud)

  • 注意没有必要使用`datetime`:`df [(df.Timestamp&gt; ='2009-05-01')&(df.Timestamp &lt;='2010-03-01')]` (2认同)