在 Pandas 数据帧上创建滚动自定义 EWMA

Ste*_*n G 3 python pandas

我正在尝试在 df 的最后 13 个值上创建具有以下衰减 = 1-ln(2)/3 的滚动 EWMA,例如:

factor
Out[36]: 
    EWMA
0  0.043
1  0.056
2  0.072
3  0.094
4  0.122
5  0.159
6  0.207
7  0.269
8  0.350
9  0.455
10 0.591
11 0.769
12 1.000
Run Code Online (Sandbox Code Playgroud)

我有这样的每月回报 df:

change.tail(5)
Out[41]: 

date                                                                                                                                    
2016-04-30      0.033         0.031     0.010     0.007     0.014    -0.006    -0.001      0.035    -0.004     0.020     0.011     0.003
2016-05-31      0.024         0.007     0.017     0.022    -0.012     0.034     0.019      0.001     0.006     0.032    -0.002     0.015
2016-06-30     -0.027        -0.004    -0.060    -0.057    -0.001    -0.096    -0.027     -0.096    -0.034    -0.024     0.044     0.001
2016-07-31      0.063         0.036     0.048     0.068     0.053     0.064     0.032      0.052     0.048     0.013     0.034     0.036
2016-08-31     -0.004         0.012    -0.005     0.009     0.028     0.005    -0.002     -0.003    -0.001     0.005     0.013     0.003
Run Code Online (Sandbox Code Playgroud)

我只是想将此滚动 EWMA 应用于每一列。我知道熊猫有 EWMA 方法,但我不知道如何传递正确的 1-ln(2)/3 因子。

帮助将不胜感激!谢谢!

rea*_*ant 5

@piRSquared 的答案是一个很好的近似值,但最后 13 个之外的值也有权重(尽管很小),所以它并不完全正确。

pandas可以做滚动窗口计算。但是,在它支持的所有滚动功能中,ewm不是其中之一,这意味着我们必须实现自己的。

假设series是我们的时间序列平均:

from functools import partial
import numpy as np

window = 13
alpha = 1-np.log(2)/3    # This is ewma's decay factor.
weights = list(reversed([(1-alpha)**n for n in range(window)]))
ewma = partial(np.average, weights=weights)
rolling_average = series.rolling(window).apply(ewma)
Run Code Online (Sandbox Code Playgroud)