sap*_*ico 5 python datetime pandas datetimeindex
我有一个名为“分数”的系列,带有日期时间索引。
最后,我要到其子集quarter和year
伪代码:series.loc['q2 of 2013']
迄今为止的尝试:
s.dt.quarter
AttributeError:只能使用具有类似日期时间的值的 .dt 访问器
s.index.dt.quarter
AttributeError: 'DatetimeIndex' 对象没有属性 'dt'
这有效(受此答案启发),但我无法相信这是在 Pandas 中执行此操作的正确方法:
d = pd.DataFrame(s)
d['date'] = pd.to_datetime(d.index)
d.loc[(d['date'].dt.quarter == 2) & (d['date'].dt.year == 2013)]['scores']
我希望有一种方法可以做到这一点,而无需转换为数据集,将索引强制为日期时间,然后从中获取系列。
我错过了什么,在 Pandas 系列上做到这一点的优雅方式是什么?
import numpy as np
import pandas as pd
index = pd.date_range('2013-01-01', freq='M', periods=12)
s = pd.Series(np.random.rand(12), index=index)
print(s)
# 2013-01-31 0.820672
# 2013-02-28 0.994890
# 2013-03-31 0.928376
# 2013-04-30 0.848532
# 2013-05-31 0.122263
# 2013-06-30 0.305741
# 2013-07-31 0.088432
# 2013-08-31 0.647288
# 2013-09-30 0.640308
# 2013-10-31 0.737139
# 2013-11-30 0.233656
# 2013-12-31 0.245214
# Freq: M, dtype: float64
d = pd.Series(s.index, index=s.index)
quarter = d.dt.quarter.astype(str) + 'Q' + d.dt.year.astype(str)
print(quarter)
# 2013-01-31 1Q2013
# 2013-02-28 1Q2013
# 2013-03-31 1Q2013
# 2013-04-30 2Q2013
# 2013-05-31 2Q2013
# 2013-06-30 2Q2013
# 2013-07-31 3Q2013
# 2013-08-31 3Q2013
# 2013-09-30 3Q2013
# 2013-10-31 4Q2013
# 2013-11-30 4Q2013
# 2013-12-31 4Q2013
# Freq: M, dtype: object
print(s[quarter == '1Q2013'])
# 2013-01-31 0.124398
# 2013-02-28 0.052828
# 2013-03-31 0.126374
# Freq: M, dtype: float64
Run Code Online (Sandbox Code Playgroud)
如果您不想创建一个包含每个季度标签的新系列(例如,如果您只进行一次子集化),您甚至可以这样做
print(s[(s.index.quarter == 1) & (s.index.year == 2013)])
# 2013-01-31 0.124398
# 2013-02-28 0.052828
# 2013-03-31 0.126374
# Freq: M, dtype: float64
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
6000 次 |
| 最近记录: |