服务器端语音识别

alo*_*loo 9 cloud speech-recognition

有人知道已经托管的任何好的服务器端语音识别引擎吗?即我希望能够调用一个简单的Web API发布一些声音数据并获取文本.不必是免费的 - 但希望可以免费试用.

Dav*_*ski 33

有几种IVR服务作为完整的应用程序托管整个VOIP会话(电话呼叫),而不是提供单个服务交易"àlacarte".如果您要使您的程序看起来像VOIP呼叫,您可以使用其中一些服务完成它.

Voxeo发布了一份免费(和低成本)IVR托管服务提供商列表,旨在帮助开发人员有限使用.毫不奇怪,所有都需要注册.

另一种可能性是直接向Vlingo,TwilioTropo询问,因为他们可能会向您推销您所需的产品.

更新:2012年7月25日

AT&T宣布推出Speech API.您发送音频 - 它返回XML或JSON数据格式的文本.另见开发者网站.

更新:2012年8月27日

另一种可能性是来自Nuance 的Dragon Mobile SDK,它针对寻求API的个人开发者,使消费者应用程序具有语音和/或文本到语音功能.

更新:2012年9月21日

似乎有几个新的供应商提供准确你在找什么:在文本进行语音样本.可编程网络上列出了以下内容:

另请注意,Loquendo现在是Nuance的一部分.

更新:2013年6月27日

AT&T的Speech API有一些有针对性的SDK(Android,iOS,PhoneGap,Titanium,W​​indows) - 其中一些是托管的GitHub.Unity 3D演示甚至还有源代码.

更新:2014年1月23日

OneTok已将其产品重新配置为SDKiOSAndroid.

显然,Voice Genie产品已被Genesys彻底消化,因此可以找到它的一点痕迹.鉴于Genesys对大型企业的定位,很难知道他们是否有任何小批量或商品.

Plumvoice似乎扩大了他们的产品.

和之前的许多人一样,Vlingo现在是Nuance的一部分.

(我试图在原始答案中更新任何损坏的链接.)

更新:2015年10月31日

让这个答案保持最新是一个Sisyphean任务.

Voxeo的免费(和低成本)IVR托管服务提供商的名单现在重新发布到AT&T Speech API,在完全公开的情况下,我现在已经在其中进行了实质性的参与,因此,取消了我提供链接到几乎任何东西而没有受到质疑的资格我的信誉.

也就是说,演讲/ NLP市场中有很多玩家.尽职尽责.

更新:2016年4月8日

所以现在谷歌完全打乱了苹果推车.

  • 感谢您保持最新! (10认同)