如何比较两个MFCC特征向量或两个语音话语的MFCC特征向量之间的相似性

Question

我已经提取了两个话语的13个MFCC特征.第一个话语的特征集大小为11*13,其他为18*13.那么,如何比较两个特征集来找到这两个词之间的相似性呢？

如果有人知道,我没有使用任何分类器,标准工具遵循哪种算法来比较MFCC特征向量.请建议我,以便我可以实施它.

Answer 1

您可以在matlab中尝试以下代码.在将mfcc用于2波之后,我们假设对于第一波mfcc1和第二波是mfcc2.代码是:

mfcc1=mfcc1';
mfcc2=mfcc2';
M=simmx(mfcc1,mfcc2);
[p,q,c]=dp(1-M);
v=c(size(c,1),size(c,2))

复制过去的代码并运行mfcc值为mfcc1和mfcc2,

我使用了dtw逻辑,我采用mfcc的逆,然后我采用相似矩阵,我找到了最低成本路径.如果它完全匹配,则值将为0,如果它接近匹配,则u将接近零值.我希望这将有所帮助.谢谢....

Answer 2

比较两个不同长度序列的算法称为“动态时间扭曲”，您可以在维基百科中找到详细的描述：

还有许多不同语言的参考实现。