AWS Lex 是否使用 AWS Transcribe 作为 ASR 来进行提示识别?

Zac*_*h S 3 amazon-web-services aws-lex amazon-transcribe

我正在尝试确定 AWS Lex 是否使用 AWS Transcribe 进行提示确认。例如,Lex 询问“你的电话号码是什么?”,用户回答“1-2-3-4”。Lex 然后问道:“你是说 1-2-3-4 吗?”。Lex 在幕后使用什么作为 ASR 来确定用户说的是“1-2-3-4”?是 AWS Transcribe 还是其他什么?

ASR*_*ASR 6

AWS Transcribe我认为除了 AWS 之外没有人知道,但 Lex 使用背后的力量(以及AWS Polly从 Lex 返回语音)确实有意义。就个人经验而言,直到 reInvent 17 宣布 Transcribe 之前大约一个月,我一直在使用LexSTT(语音转文本)。然后这是可能的,因为intents可以被忽略并传递给Lambda处理程序。提供给Lambda处理程序的 JSON 数据包包含已识别的语音(作为文本),我将其返回给调用者。然而,在他们宣布之后的某个时间Transcribe,这不再起作用,因为intents不能再被忽视了。除了 in 之外的任何输入都intents将返回配置的错误响应。我猜他们在推出 Transcribe 时就停止了这一点。

附录:AWS Transcribe是纯ASR(自动语音识别或语音转文本)。它返回识别的语音和元数据(置信度等)。

AWS Lex可以设计自己的机器人来自动响应查询(就像在 Alexa 中一样)