相关疑难解决方法(0)

为LSTM二进制分类构建语音数据集

我正在尝试使用theano进行二进制LSTM分类.我已经完成了示例代码,但是我想构建自己的代码.

我正在使用一小段"Hello"和"Goodbye"录音.我通过为它们提取MFCC功能并将这些功能保存在文本文件中来预处理这些功能.我有20个语音文件(每个10个),我为每个单词生成一个文本文件,因此包含MFCC功能的20个文本文件.每个文件都是13x56矩阵.

我现在的问题是:如何使用此文本文件来训练LSTM?

我对此比较陌生.我也经历了一些关于它的文献,但没有找到对这个概念的真正理解.

使用LSTM的任何更简单的方法也是受欢迎的.

speech-recognition python-2.7 mfcc theano lstm

6
推荐指数
1
解决办法
7125
查看次数

标签 统计

lstm ×1

mfcc ×1

python-2.7 ×1

speech-recognition ×1

theano ×1