我是 R 新手,我一直使用电子视图,现在我必须进行回归
我有 Xt 静止的和 Yt 不静止的,所以我需要区分
yt=Yt-Y(t-1)
那么回归是
yt = a + bXt
我怎样才能对 R 进行预测并获得“真实”值而不是差异?
在 e-views 中可以写,d(Yt)
但在 R 中是不可能的
预测时间序列后,我们可以使用自动绘图来绘制时间序列及其预测。我正在使用该forecast
包。但我想控制预测部分的置信区间。如何使绘图仅显示 95% 间隔或仅 80% 间隔,或根本不显示间隔。我将参数设置conf.int
为FALSE
. 但它似乎并没有抑制图中的conf间隔。任何人都可以帮助使其发挥作用吗?谢谢。
fc <- ses(AirPassengers, h = 5)
autoplot(fc, conf.int = F)
Run Code Online (Sandbox Code Playgroud) 我正在 statsmodels 中运行带有外生变量的 ARIMA 模型,并且我尝试在不知道外生变量的未来值的情况下对未来的多个步骤进行预测。exog
中的选项需要results.forecast()
样本值。我想知道是否可以在不知道这些值的情况下对未来多天进行预测?
如果问题不清楚,假设我将我的智商建模为时间序列变量,并将受教育年限作为外生变量。我在高中结束时训练模型,我想预测 4 年后我的智商,但我不知道我是否会继续上学。我可以在不知道自己的上学年数的情况下使用 statsmodels 进行预测吗?谢谢!
我的数据框是每小时一次(我的 df 的索引),我想预测 y。
> df.head()
Date y
2019-10-03 00:00:00 343
2019-10-03 01:00:00 101
2019-10-03 02:00:00 70
2019-10-03 03:00:00 67
2019-10-03 04:00:00 122
Run Code Online (Sandbox Code Playgroud)
我现在将导入库并训练模型:
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
from sklearn.preprocessing import MinMaxScaler
min_max_scaler = MinMaxScaler()
prediction_hours = 24
df_train= df[:len(df)-prediction_hours]
df_test= df[len(df)-prediction_hours:]
print(df_train.head())
print('/////////////////////////////////////////')
print (df_test.head())
training_set = df_train.values
training_set = min_max_scaler.fit_transform(training_set)
x_train = training_set[0:len(training_set)-1]
y_train = training_set[1:len(training_set)]
x_train = np.reshape(x_train, (len(x_train), 1, 1))
num_units = 2
activation_function = 'sigmoid'
optimizer = …
Run Code Online (Sandbox Code Playgroud) 我有三年的每日收入数据.每年有一些相当稳定的数据增长,但数据是高度季节性的,在第四季度(黑色星期五,在圣诞节狂热之前等)和周内seansonaly(周一收入高,本周越来越少,最低)出现巨大高峰星期六,星期天开始接受)
我不想使用带有线性预测的无聊电子表格,而是想要一个R脚本,它需要输入三年的每日数据并应用算法来预测未来6个月的每日收入预测.我希望输入只是一个包含日期和收入数字的CSV文件.
我听说ARIMA很好,但我的经济学家朋友看到我的数据认为用卡尔曼滤波器预测会产生非常好的结果.
有人可以发布一个脚本来告诉我如何应用ARIMA算法或卡尔曼滤波器算法来预测我的数据吗?谢谢!
我每个周期工作30天(每月),因此在我的历史数据集中有大约2个周期.
R
脚本是,
library(forecast)
value <- c(117.2 , 224.2 , 258.0 , 292.1 , 400.1 , 509.9 , 626.8 , 722.9 , 826.1 , 883.6,916.6, 1032.1, 1151.2, 1273.4 ,1391.8, 1499.2, 1532.5 ,1565.9 ,1690.9, 1813.6,1961.4 ,2102.8 ,2208.2, 2256.8, 2290.8 ,2413.7, 2569.4 ,2730.3, 2882.9 ,2977.5, 117.2 , 224.2 , 258.0 , 292.1 , 400.1 , 509.9 , 626.8 , 722.9 , 826.1 , 883.6,916.6, 1032.1, 1151.2, 1273.4 ,1391.8, 1499.2, 1532.5 ,1565.9 ,1690.9, 1813.6,1961.4 ,2102.8 ,2208.2, 2256.8, 2290.8 ,2413.7, 2569.4 ,2730.3, 2882.9 ,2977.5) …
Run Code Online (Sandbox Code Playgroud) 我有以下模式的时间序列,我想知道是否有人可以分享一个聪明的技巧来删除前导零.我想避免的原因是它可能对预测模型的选择产生负面影响.
示例时间序列:
TimeSeries <- ts(c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 9, 10, 10, 16, 7, 13, 0, 9, 1,
11, 2, 11, 3, 11, 4, 1, 20, 13, 18, 19, 16, 16, 16,
15, 14, 27, 24, 35, 8, 18, 21, 20, 19, 22, 18, 21
),start=c(2001,6),frequency=12)
Run Code Online (Sandbox Code Playgroud)
我可以设想一个缩小领先零序列的过程,用时间序列的子集执行多个测试,然后只用零删除前导子集.然而,这将是麻烦的过程,其在计算方面可能是低效的.
是否有人知道已经存在的功能或程序有效地执行此操作?
我从www.nasdaq.com下载了TESLA股票;下载CSV文件后,我意识到我需要使用Microsoft Excel 2016转换CSV。然后单击“文本到列”。标头现在很清楚,它们是:日期,收盘价,成交量,开盘价,最高价,最低价。请在此处查看csv文件。LinK:https://drive.google.com/open ? id = 1cirQi47U4uumvA14g6vOmgsXbV-YvS4l
Preview (The CSV data is from 02/02/2017 until 02/02/2018):
1. date | close | volume | open | high | low |
2. 02/02/2018 | 343.75 | 3696157 | 348.44 | 351.95 | 340.51|
3. 01/02/2018 | 349.25 | 4187440 | 351.00 | 359.66 | 348.63|
Run Code Online (Sandbox Code Playgroud)
我面临的挑战是创建每个月的数据指针,并使其尽可能接近每月的第一天。我过滤了excel文件,这就是我得到的数据。
- date | close
- 01/02/2018 | 349.25
- 02/01/2018 | 320.53
- 01/12/2017 | 306.53
- 01/11/2017 | 321.08
- 02/10/2017 | 341.53 …
Run Code Online (Sandbox Code Playgroud) 我尝试在R中使用预测包.在将来绘制多个样本的预测时,我得到一个常数函数.这是什么原因?
我正在尝试使用R进行预测,但每次下载预测包时,都会显示rcpp软件包未正确安装的错误.结果我无法运行预测.请问你能告诉我什么是错的或者我需要做什么.
forecasting ×10
r ×7
time-series ×4
python ×2
arima ×1
csv ×1
exponential ×1
keras ×1
lstm ×1
rcpp ×1
statsmodels ×1