Python:“Pandas 数据转换为对象的 numpy dtype。使用 np.asarray(data) 检查输入数据。”

Jul*_*zar 3 python mysql time-series pandas arima

我正在尝试创建一个 ARIMA 模型,用于使用服务器中的一些数据来预测时间序列,并且我在标题上显示错误,但我不知道我需要什么类型的对象。这是代码:

frame = pd.read_sql(query, con=connection)
connection.close()
frame['time_field'] = pd.to_timedelta(frame['time_field'])
print(frame.head(10))
#fitting
model = ARIMA(frame, order=(5,1,0))
model_fit = model.fit(disp=0)
Run Code Online (Sandbox Code Playgroud)

我见过这样的例子: https: //machinelearningmastery.com/arima-for-time-series-forecasting-with-python/

他们使用日期而不是时间以及各自的值。这是帧值的输出:

time_field   value_field
0 00:00:14  283.80
1 00:01:14  271.97
2 00:02:14  320.53
3 00:03:14  346.78
4 00:04:14  280.72
5 00:05:14  277.41
6 00:06:14  308.65
7 00:07:14  321.27
8 00:08:14  320.68
9 00:09:14  332.32
Run Code Online (Sandbox Code Playgroud)

小智 5

您需要将“time_field”列作为数据框的索引(在ARIMA模型中,我们应该始终将日期时间列设置为数据框的索引)

frame=frame.set_index('time_field')
model = ARIMA(frame, order=(5,1,0))
model_fit = model.fit(disp=0)
Run Code Online (Sandbox Code Playgroud)

注意:- 当您设置索引列时,如果索引列有任何重复值,您可能会收到错误消息。所以在这种情况下,你最好通过求和来进行分组。

frame = frame.groupby(['time_field']).agg({'value_field': 'sum'}) 
or
frame = frame.groupby(['time_field']).sum()
Run Code Online (Sandbox Code Playgroud)