用熊猫总结几个月

Joo*_*oop 7 python time-series pandas

我知道有一个简单的实现,但我不记得语法.有一个简单的熊猫时间序列,我想按月汇总数据.具体来说,我想在数月和数年内添加数据以获得一些摘要.可以用切片编写它,但我记得看到自动执行它的语法.

import pandas as pd
df = Series(randn(100), index=pd.date_range('2012-01-01', periods=100))
Run Code Online (Sandbox Code Playgroud)

具有年份和子指数的多指数系列将成为一等奖.

部分答案:

ds.resample('M', how=sum)  # for calendar monthly
ds.resample('A', how=sum)  # for calendar yearly
Run Code Online (Sandbox Code Playgroud)

任何想法如何优雅地获得年度多指数?

Jef*_*eff 17

In [1]: import pandas as pd
        from numpy.random import randn

In [2]: df = Series(randn(500), index=pd.date_range('2012-01-01', periods=500))

In [3]: s2 = df.groupby([lambda x: x.year, lambda x: x.month]).sum()

In [4]: s2
Out[4]: 
2012  1      3.853775
      2      4.259941
      3      4.629546
      4    -10.812505
      5    -16.383818
      6     -5.255475
      7      5.901344
      8     13.375258
      9      1.758670
      10     6.570200
      11     6.299812
      12     7.237049
2013  1     -1.331835
      2      3.399223
      3      2.011031
      4      7.905396
      5      1.127362
dtype: float64
Run Code Online (Sandbox Code Playgroud)

  • 有没有理由你使用lamdba而不是使用df.index.year和df.index.month(我更喜欢)?在性能上似乎几乎相同. (3认同)
  • 它们是等价的,我只是使用``lambda``来表示更动态的计算,例如你可以做任何事情) (3认同)