如何提高ios中的语音识别数字输入?

Eri*_*ric 5 speech-recognition ios sfspeechrecognizer

我正在使用ios语音识别,只要有足够的上下文,它就会很好.我正在使用语音识别仅用于数字输入并且看到问题.例如,使用单个数字(例如2 - ,或8 - ate); 没有足够的背景.或者甚至有两位数字(80有时被翻译为白痴).我想向语音识别器表明输入将是数字.例如,如果输入是"数字2",那么语音识别器就能完成出色的工作.

我已经玩了一些提示--SFSpeechRecognitionTaskHint(未指定,听写,搜索,确认) - 但这些模式都不适合数字输入.

所以,问题是:

  • 有没有办法向SFSpeechRecognizer提示音频是否为数字?要么
  • 还有另一种语音识别技术可能更适合我的需求吗?

另请注意,我希望这也适用于许多不同的语言(不仅仅是英语).

谢谢你的帮助,埃里克

sha*_*sha 2

当前语音框架中没有任何内容允许您仅针对数字进行自定义。如果您说在文本前添加“数字”一词效果更好 - 您可以尝试录制带有“数字”声音的语音文件,并将该文件动态附加到用户所说的任何内容中,以便您获得正确的识别。识别完成后,从语音框架收到​​的文本中剪切单词“数字”。这听起来很奇怪,但我不确定还有其他解决方案。

更新

另一种选择是等待并分析您将在SFSpeechTranscriptionResult.transcriptions[] https://developer.apple.com/documentation/speech/sfspeechrecognitionresult/1648282-transcriptions中收到的多个变体

等到该数组包含可以解释为数字的内容,并且不接受第一个可用的数组。