Python中滚动关联数据框的滚动平均值?

Nic*_*ler 5 python yahoo matrix correlation pandas

Python初学者在这里.

到目前为止我做了什么:

  • 雅虎财经从股票列表中导入的价格数据.

  • 在股票(每个组合)之间,将20天滚动相关性计算为数据帧.

我想要:

1)计算20天滚动相关性中的每一天的200天简单移动平均值.

2)以矩阵形式报告200天移动平均线结果.

如何在python/pandas中执行此操作?谢谢,这对我有帮助!


这是我到目前为止所拥有的......

import pandas as pd
from pandas import DataFrame
import datetime
import pandas.io.data as web
from pandas.io.data import DataReader

stocks = ['spy', 'gld', 'uso']
start = datetime.datetime(2014,1,1)
end = datetime.datetime(2015,1,1)

f = web.DataReader(stocks, 'yahoo', start, end)
adj_close_df = f['Adj Close']

correls = pd.rolling_corr(adj_close_df, 20)

means = pd.rolling_mean(correls, 200) #<---- I get an error message here!
Run Code Online (Sandbox Code Playgroud)

Ale*_*der 4

这是回答问题 1-3 的开始(每个帖子只能有一个问题)。

import pandas.io.data as web
import datetime as dt
import pandas as pd

end_date = dt.datetime.now().date()
start_date = end_date - pd.DateOffset(years=5)

symbols = ['AAPL', 'IBM', 'GM']
prices = web.get_data_yahoo(symbols=symbols, start=start_date, end=end_date)['Adj Close']
returns = prices.pct_change()
rolling_corr = pd.rolling_corr_pairwise(returns, window=20)
Run Code Online (Sandbox Code Playgroud)

对于单个股票相对于所有其他股票而言,获得滚动相关性的滚动平均值相对简单。例如:

pd.rolling_mean(rolling_corr.major_xs('AAPL').T, 200).tail()
Out[34]: 
            AAPL        GM       IBM
Date                                
2015-05-08     1  0.313391  0.324728
2015-05-11     1  0.315561  0.327537
2015-05-12     1  0.317844  0.330375
2015-05-13     1  0.320137  0.333189
2015-05-14     1  0.322119  0.335659
Run Code Online (Sandbox Code Playgroud)

要查看最近 200 天窗口的相关矩阵:

>>> rolling_corr.iloc[-200:].mean(axis=0)
          AAPL        GM       IBM
AAPL  1.000000  0.322119  0.335659
GM    0.322119  1.000000  0.383672
IBM   0.335659  0.383672  1.000000
Run Code Online (Sandbox Code Playgroud)