我正在尝试创建在大型音乐数据集上训练的模型。MIDI 文件被转换为 numpy 数组。由于 LSTM 需要顺序数据,因此在转换为 LSTM 序列时数据集大小变得非常巨大。
我根据基调和持续时间将 MIDI 音符转换为索引,因此我得到了 6 个 C4 调的类别。同样,我从 C3 到 B5,总共 288 节课,包括休息时间的课。
单个 MIDI 的转换格式如下所示。
midi = [0,23,54,180,23,45,34,.....];
为了训练 LSTM,x 和 y 变为
x = [[0,23,54..45],[23,54,..,34],...];
y=[[34],[76],...]
x 和 y 中的值进一步转换为 one-hot 编码。因此,对于 60 个小型 mid 文件来说,数据大小就变得很大,但我有 1700 个文件。如何使用如此数量的文件训练模型。我检查了 ImageGenerator,但它要求数据位于单独的类目录中。如何实现这一目标?