小编Mic*_*ton的帖子

验证损失远高于训练损失

我对深度学习模型非常陌生,并尝试使用带有 Keras Sequential 的 LSTM 训练多时间序列模型。50 年中每年有 25 个观测值 = 1250 个样本,因此不确定是否可以将 LSTM 用于如此小的数据。但是,我有数千个特征变量,不包括时间滞后。我正在尝试预测接下来 25 个时间步长的数据序列。数据在 0 和 1 之间标准化。我的问题是,尽管尝试了许多明显的调整,但我无法在任何接近训练损失的地方获得 LSTM 验证损失(我认为过度拟合)。

我尝试调整每个隐藏层的节点数 (25-375)、隐藏层数 (1-3)、dropout (0.2-0.8)、batch_size (25-375) 和训练/测试分割 (90%:10) % - 50%-50%)。没有什么对验证损失/训练损失差异有太大影响。

# SPLIT INTO TRAIN AND TEST SETS
# 25 observations per year; Allocate 5 years (2014-2018) for Testing
n_test = 5 * 25
test = values[:n_test, :]
train = values[n_test:, :]

# split into input and outputs
train_X, train_y = train[:, :-25], train[:, -25:]
test_X, test_y = test[:, …
Run Code Online (Sandbox Code Playgroud)

machine-learning deep-learning lstm keras

4
推荐指数
1
解决办法
1万
查看次数

标签 统计

deep-learning ×1

keras ×1

lstm ×1

machine-learning ×1