如何从Google智能助理接收答案作为字符串,而不是音频流

Tow*_*rss 3 python google-assist-api google-assistant-sdk

我正在使用Assistant SDK中的python库通过gRPC进行语音识别.我已经演讲认可并作为一个字符串返回调用该方法resp.result.spoken_request_text\googlesamples\assistant\__main__.py和我有答案,因为从与方法助手API的音频流resp.audio_out.audio_data也从\googlesamples\assistant\__main__.py

我想知道是否有可能将服务的答案作为字符串(希望它在服务定义中可用或者可以包含它),以及我如何以字符串形式访问/请求答案.

提前致谢.

Pri*_*ner 5

目前(Assistant SDK Developer Preview 1),没有直接的方法可以做到这一点.您可以将音频流馈送到语音到文本系统,但这真的开始变得愚蠢.

在谷歌I/O期间向工程师讲述了这个问题时,他们表示他们在这方面有一些技术上的复杂性,但是他们了解用例.他们需要看到这样的问题才能知道人们想要这个功能.

希望它能成为即将发布的开发者预览版.