标签: speech-to-text

来自RecognitionListener的onBufferReceived:我知道,这不起作用,只是测试它看看会发生什么,而onBufferReceived永远不会被调用(使用JB 4.3在galaxy nexus上测试)
使用媒体录像机:不工作.它突破了语音识别.麦克风只允许一个操作
试图找到识别服务在执行语音之前保存临时音频文件到文本api复制它的地方,但没有成功

我几乎绝望,但我只是注意到Google Keep应用程序正在做我需要做的事情!我使用logcat稍微调试了keep应用程序,app也调用了"RecognizerIntent.ACTION_RECOGNIZE_SPEECH"(就像我们开发人员一样)来触发语音到文本.但是,如何继续保存音频？它可以成为隐藏的api吗？是谷歌"作弊":)？

谢谢您的帮助

最好的祝福

android speech-recognition speech-to-text

Sli*_*lim

2017 12-30

24
推荐指数

2
解决办法

2万
查看次数

有没有办法直接使用SpeechRecognizer API进行语音输入？

Android Dev网站提供了使用内置Google语音输入活动进行语音输入的示例.该活动显示带麦克风的预配置弹出窗口并使用其传递结果onActivityResult()

我的问题:有没有办法SpeechRecognizer直接使用该类进行语音输入而不显示固定活动？这将让我构建自己的语音输入活动.

android speech-recognition speech-to-text

vla*_*ien

2014 11-05

22
推荐指数

2
解决办法

3万
查看次数

语音输入在android中填充编辑文本？

我正在研究android中的语音输入.我用过的样本

http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/apis/app/VoiceRecognition.html

在Xperia X10上进行测试时,我得到了"现在说话"对话框,但在我输入一些声音之前,它就会关闭.我正在尝试实施语音搜索,例如,如果语音输入是詹姆斯邦德,那么我想填写名字中的詹姆斯编辑文本和姓氏编辑文本中的邦德.这将在数据库中搜索名称.但在尝试使用API Demo示例时,它无法正常工作.可能是我错过了什么.是否有人发布任何声音输入样本而不是ApiDemos样本.

提前致谢.

android speech-to-text

Pan*_*che

2011 12-26

20
推荐指数

1
解决办法

2万
查看次数

针对盲人的JavaScript语音转文本

我正在开发一个网站,我想帮助盲人通过语音使用它,所以我将使用:

文本到语音,为用户提供一些可能性
语音到文本,允许用户使用她的语音选择一个

我已经有了一些文本到语音的JavaScript库(比如speak.js),但现在我需要一个很好的语音到文本.有一些解决方案用于此目的(如speechapi),但他们使用Java Applets或Flash,我想只依赖JavaScript,以避免插件.

我正在尝试使用x-webkit-speech和Google Chrome进行HTML5的语音输入,这很好,但你需要点击一个图标(盲人不能很好地使用鼠标).使用x-webkit-speech按键是否可行？你知道任何替代API(JavaScript)吗？

谢谢!

javascript html5 speech-recognition google-chrome speech-to-text

sgm*_*nda

lucky-day

20
推荐指数

1
解决办法

5620
查看次数

从网络流式传输音频时，无法从Google文本获取结果到语音API

我想从网络流式传输音频，然后使用python google-cloud-speechAPI 将其转换为文本。我已经将其集成到我的Django频道代码中。

对于前端，我直接复制了此代码，而后端则具有此代码（请参见下文）。现在，问题来了，我没有收到任何异常或错误，但是我没有从Google API得到任何结果...

我试过的

我将调试点放入process函数循环中，控件永远不会到达循环内部。
我在这里遍历了Java代码，并试图理解它...我已经在本地设置了Java代码并对其进行了调试。我了解的一件事是在Java代码中，该方法onWebSocketBinary正在接收一个整数数组，从前端我们像这样发送
```
socket.send(Int16Array.from(floatSamples.map(function (n) {return n * MAX_INT;})));
```
Run Code Online (Sandbox Code Playgroud)
在Java中，它们将转换为字节串，然后发送给Google。在django中，我放了调试点，并注意到我正在以二进制字符串形式获取数据...因此，我觉得我不需要执行任何操作...但是，我尝试了几种方法将其转换为整数数组，但是没有用，因为google期望以字节为单位...（您可以在下面看到带注释的代码）
我经历了这个示例代码，它来自谷歌，我正在做同样的事情，我不明白我在这里做错了什么。

谁能帮我？？？

Django代码：

import json

from channels.generic.websocket import WebsocketConsumer

# Imports the Google Cloud client library
from google.cloud import speech
from google.cloud.speech import enums
from google.cloud.speech import types

# Instantiates a client
client = speech.SpeechClient()
language_code = "en-US"
streaming_config = None


class SpeechToTextConsumer(WebsocketConsumer):
    def connect(self):
        self.accept()

    def disconnect(self, close_code):
        pass …

Run Code Online (Sandbox Code Playgroud)

django speech-to-text google-speech-api django-channels google-cloud-speech

Lok*_*lli

2019 05-17

20
推荐指数

1
解决办法

426
查看次数

Powershell可以说话,但如果我说话,它可以写吗？

以下是使PowerShell发言的方法.

Add-Type -AssemblyName System.Speech
$synthesizer = New-Object -TypeName System.Speech.Synthesis.SpeechSynthesizer
$synthesizer.Speak('Hey, I can speak!')

Run Code Online (Sandbox Code Playgroud)

其实我想反对.如果我说话,可以将powershell转换成字母.

如果我在我的录音机中说"嘿,我可以说",它会转换成文字吗？

如果可能请指导我如何实现它？

powershell speech-recognition speech-to-text powershell-2.0

Sam*_*abu

lucky-day

19
推荐指数

1
解决办法

6695
查看次数