使用 3 个月数据集进行多变量时间序列预测

Question

使用 3 个月数据集进行多变量时间序列预测

dpe*_*per 13 python machine-learning time-series prediction

我生成了 3 个月的数据（每一行对应每一天），我想对相同的数据执行多变量时间序列分析：

可用的列是 -

Date    Capacity_booked Total_Bookings  Total_Searches  %Variation

Run Code Online (Sandbox Code Playgroud)

每个日期在数据集中有 1 个条目并且有 3 个月的数据，我想拟合一个多元时间序列模型来预测其他变量。

到目前为止，这是我的尝试，我试图通过阅读文章来实现相同的目标。

我做了同样的 -

df['Date'] = pd.to_datetime(Date , format = '%d/%m/%Y')

data = df.drop(['Date'], axis=1)

data.index = df.Date

from statsmodels.tsa.vector_ar.vecm import coint_johansen
johan_test_temp = data
coint_johansen(johan_test_temp,-1,1).eig



#creating the train and validation set
train = data[:int(0.8*(len(data)))]
valid = data[int(0.8*(len(data))):]

freq=train.index.inferred_freq

from statsmodels.tsa.vector_ar.var_model import VAR

model = VAR(endog=train,freq=train.index.inferred_freq)
model_fit = model.fit()


# make prediction on validation
prediction = model_fit.forecast(model_fit.data, steps=len(valid))

cols = data.columns

pred = pd.DataFrame(index=range(0,len(prediction)),columns=[cols])
    for j in range(0,4):
        for i in range(0, len(prediction)):
           pred.iloc[i][j] = prediction[i][j]

Run Code Online (Sandbox Code Playgroud)

我有一个验证集和预测集。然而，预测远比预期的要糟糕。

数据集的图是 - 1. % Variation