我试图了解如何正确地将数据输入到我的keras模型中,以使用LSTM神经网络将多元时间序列数据分为三类。
我已经查看了不同的资源-主要是Jason Brownlee发表的这三篇优秀的博客文章post1,post2,post3),其他SO 问题和不同的论文,但是那里提供的信息都不完全适合我的问题情况,因此我无法弄清楚如果我的数据预处理/输入到模型中的数据是正确的,那么我想如果在这里指定确切的条件可能会得到一些帮助。
我正在尝试对多元时间序列数据进行分类,其原始形式的结构如下:
我有200个样本
一个示例是一个csv文件。
一个样本可以具有1到50个功能(即,csv文件具有1到50列)。
每个功能的值在固定的时间步长上被“跟踪”,比如说100(即,每个csv文件恰好有100行)。
每个csv文件都有以下三个类之一(“好”,“太小”,“太大”)
因此,我的当前状态如下:
我有一个具有以下结构的numpy数组“样本”:
# array holding all samples
[
# sample 1
[
# feature 1 of sample 1
[ 0.1, 0.2, 0.3, 0.2, 0.3, 0.1, 0.2, 0.4, 0.5, 0.1, ... ], # "time series" of feature 1
# feature 2 of sample 1
[ 0.5, 0.6, 0.7, 0.6, 0.4, 0.3, 0.2, 0.1, -0.1, -0.2, ... ], # "time series" …Run Code Online (Sandbox Code Playgroud)