在任何处理统计和时间序列分析(pandas和statsmodel)的Python模块中,我找不到任何有关功能的参考信息来执行Johansen协整测试。是否有人知道周围是否有一些代码可以对时间序列之间的协整性进行这种测试?谢谢你的帮助,
马鲁齐奥
尝试在pandas中重新索引数据帧时,我有一个非常奇怪的行为.我的Pandas版本是0.10.0,我使用的是Python 2.7.基本上,当我加载数据帧时:
eurusd = pd.DataFrame.load('EUR_USD_30Min.df').drop_duplicates().dropna()
eurusd
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 119710 entries, 2003-02-02 17:30:00 to 2012-12-28 17:00:00
Data columns:
open 119710 non-null values
high 119710 non-null values
low 119710 non-null values
close 119710 non-null values
dtypes: float64(4)
Run Code Online (Sandbox Code Playgroud)
然后我尝试在更大的日期范围内重新索引:
newindex = pd.DateRange(datetime.datetime(2002,1,1), datetime.datetime(2012,12,31), offset=pd.datetools.Minute(30))
newindex
<class 'pandas.tseries.index.DatetimeIndex'>
[2002-01-01 00:00:00, ..., 2012-12-31 00:00:00]
Length: 192817, Freq: 30T, Timezone: None
Run Code Online (Sandbox Code Playgroud)
尝试重新索引数据帧时,我会遇到奇怪的行为.如果我重新索引数据集的一个较大部分,我会收到此错误:
eurusd[29558:29560].reindex(index=newindex)
Exception: Reindexing only valid with uniquely valued Index objects
Run Code Online (Sandbox Code Playgroud)
但是,如果我对上面两个数据子集做同样的事情,我不会得到错误:
这是第一个子集,没有问题,
eurusd[29558:29559].reindex(index=newindex)
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 192817 entries, 2002-01-01 00:00:00 to 2012-12-31 00:00:00 …Run Code Online (Sandbox Code Playgroud) 我有一个字符串列表,当找到'y'或'm'时,每个字符串都需要拆分:
mylist = ['3m10y','10y20y','18m2y']
Run Code Online (Sandbox Code Playgroud)
在以下项目中:
splitlist = [['3m','10y'],['10y','20y'],['18m','2y']]
Run Code Online (Sandbox Code Playgroud)
我正在考虑使用re.split()但是我不能使用'或'条件来告诉函数在找到'm'或'y'时拆分.
任何帮助赞赏!谢谢