我正在尝试使用theano进行二进制LSTM分类.我已经完成了示例代码,但是我想构建自己的代码.
我正在使用一小段"Hello"和"Goodbye"录音.我通过为它们提取MFCC功能并将这些功能保存在文本文件中来预处理这些功能.我有20个语音文件(每个10个),我为每个单词生成一个文本文件,因此包含MFCC功能的20个文本文件.每个文件都是13x56矩阵.
我现在的问题是:如何使用此文本文件来训练LSTM?
我对此比较陌生.我也经历了一些关于它的文献,但没有找到对这个概念的真正理解.
使用LSTM的任何更简单的方法也是受欢迎的.