语音识别中是否存在能够区分不同人群语音的研究?

for*_*jam 5 speech-recognition machine-learning data-mining voice-recognition

我想出了一个想法,我想开发一个应用程序来区分/自动检测来自不同人的声音.

示例用例:在使用奥巴马和罗姆尼的数据进行培训后,应用程序将能够检测到任何一个人再次说话(不需要来自训练数据的相同内容)

我想知道是否有任何现有的研究.(我不知道如何搜索这个.我尝试了几个关键字并没有取得重大成果.)

如果没有,开始的好方法是什么?如何选择功能,数据表示,模型等

谢谢!

Emi*_*röm 5

我在维基百科上找到了说话人识别,后者又与文本无关的说话人识别概述:从特征到超级向量(Kinnunen,Li,2010).

从论文摘要:

本文概述了自动说话人识别技术,重点是文本无关识别.几十年来,人们一直在积极研究说话人识别.我们概述了经典方法和最先进的方法.