Dor*_*rki 16 python time-series pandas statsmodels arima
所以我有一个包含两列的 CSV 文件:日期和价格,但是当我尝试在该时间序列上使用 ARIMA 时,我遇到了这个错误:
ValueWarning:提供了日期索引,但它没有相关的频率信息,因此在预测时将被忽略。
'在例如预测时被忽略。', ValueWarning)
所以我发现了这两个问题:
ValueWarning:未提供频率信息,因此将使用推断频率 MS
但是当我尝试运行示例中的代码(第二个链接)时:
import pandas as pd
from statsmodels.tsa.arima_model import ARMA
df=pd.DataFrame({"val": pd.Series([1.1,1.7,8.4 ],
index=['2015-01-15 12:10:23','2015-02-15 12:10:23','2015-03-15 12:10:23'])})
print df
'''
val
2015-01-15 12:10:23 1.1
2015-02-15 12:10:23 1.7
2015-03-15 12:10:23 8.4
'''
print df.index
'''
Index([u'2015-01-15 12:10:23',u'2015-02-15 12:10:23',u'2015-03-15 12:10:23'], dtype='object')
'''
df.index = pd.DatetimeIndex(df.index)
print df.index
'''
DatetimeIndex(['2015-01-15 12:10:23', '2015-02-15 12:10:23',
'2015-03-15 12:10:23'],
dtype='datetime64[ns]', freq=None)
'''
model = ARMA(df["val"], (1,0))
print model
Run Code Online (Sandbox Code Playgroud)
我也收到了同样的 ValueWarning,所以我试图改变这一行:
df.index = pd.DatetimeIndex(df.index)
Run Code Online (Sandbox Code Playgroud)
对此:
df.index = pd.DatetimeIndex(df.index.values, freq=df.index.inferred_freq)
Run Code Online (Sandbox Code Playgroud)
但是后来我收到了这个错误:
AttributeError: 'Index' 对象没有属性 'inferred_freq'
Qua*_*ang 24
您当前的索引,如打印的,是字符串索引。您应该将其转换为DatetimeIndex并通过以下方式传递频率to_period:
df.index = pd.DatetimeIndex(df.index).to_period('M')
Run Code Online (Sandbox Code Playgroud)