Pandas 如何使用 dt 按月和年分组

ima*_*tha 2 python pandas

我只是想知道如何使用 pandas.series.dt 按年份和月份进行分组。

下面的代码仅按年份分组,但我如何添加进一步的过滤器以按月分组。

Data = {'Date':['21.10.1999','30.10.1999','02.11.1999','17.08.2000','09.10.2001','14.07.2000'],'X': [10,20,30,40,50,60],'Y': [5,10,15,20,25,30]}

df = pd.DataFrame(Data)

#Convert to pandas date time
df['Date'] = pd.to_datetime(df['Date'])

#Obtain dataframe dtypes
print(df.dtypes)

print(df)
print(df.groupby(df['Date'].dt.year).sum())
Run Code Online (Sandbox Code Playgroud)

jez*_*ael 6

我只是想知道如何使用 pandas.series.dt 按年份和月份进行分组。

您可以通过Series.dt.yearSeries.dt.monthto renamegroupby不需要新列:

print(df.groupby([df['Date'].dt.year.rename('y'), df['Date'].dt.month.rename('m')]).sum())
          X   Y
y    m         
1999 2   30  15
     10  30  15
2000 7   60  30
     8   40  20
2001 9   50  25
Run Code Online (Sandbox Code Playgroud)

另一种解决方案:

如果使用DataFrame.resampleGrouperthen 添加之间所有缺失的日期时间(应该是好的还是不好的):

print(df.resample('MS', on='Date').sum())
Run Code Online (Sandbox Code Playgroud)
print(df.groupby(pd.Grouper(freq='MS', key='Date')).sum())
Run Code Online (Sandbox Code Playgroud)

或者通过以下方式将日期时间转换为月份周期Series.dt.to_period

print(df.groupby(df['Date'].dt.to_period('m')).sum())
          X   Y
Date           
1999-02  30  15
1999-10  30  15
2000-07  60  30
2000-08  40  20
2001-09  50  25
Run Code Online (Sandbox Code Playgroud)