在Vista上使用Microsoft的SAPI 5.3 Speech API,您如何以编程方式对RecoProfile进行声学模型培训?更具体地说,如果您有一个文本文件和一个用户说出该文本的音频文件,您将使用该文本和音频训练用户的个人资料进行什么样的SAPI调用?
关于这个问题的更多信息我还没有解决:你在"开头"调用ISpRecognizer2.SetTrainingState(TRUE,TRUE),在"结尾"调用ISpRecognizer2.SetTrainingState(FALSE,TRUE).但目前还不清楚这些行动何时必须相对于其他行动发生.
例如,您必须进行各种调用以设置语法,其中包含与您的音频匹配的文本,以及其他用于连接音频的调用,以及对各种对象的其他调用,以表示"您现在可以开始使用".但是什么是相互依赖性 - 在其他什么之前必须发生什么?如果您使用音频文件而不是系统麦克风进行输入,这是否会使相对时间变得不那么宽容,因为识别器不会继续坐在那里听,直到说话者正确?