for*_*jam 5 speech-recognition machine-learning data-mining voice-recognition
我想出了一个想法,我想开发一个应用程序来区分/自动检测来自不同人的声音.
示例用例:在使用奥巴马和罗姆尼的数据进行培训后,应用程序将能够检测到任何一个人再次说话(不需要来自训练数据的相同内容)
我想知道是否有任何现有的研究.(我不知道如何搜索这个.我尝试了几个关键字并没有取得重大成果.)
如果没有,开始的好方法是什么?如何选择功能,数据表示,模型等
谢谢!
我在维基百科上找到了说话人识别,后者又与文本无关的说话人识别概述:从特征到超级向量(Kinnunen,Li,2010).
从论文摘要:
本文概述了自动说话人识别技术,重点是文本无关识别.几十年来,人们一直在积极研究说话人识别.我们概述了经典方法和最先进的方法.