小编jmm*_*jmm的帖子

如何正确地将音频文件发送到 Google Speech API？

我正在尝试通过以下演示在 Android 中实现 Google Speech API：https : //github.com/GoogleCloudPlatform/android-docs-samples

通过使用位于 R.raw 中的给定“audio.raw”文件，我能够在我的应用程序中成功重现该示例，并且一切正常。但是，当我尝试使用自己的音频文件时，它返回“API 成功”而没有任何转录文本。我不确定它是否与文件的路径或编码有关，因此我将包含两者的信息以防万一。

编码

我的音频文件是通过 MediaRecorder 录制语音获得的。这些是设置：

    myAudioRecorder = new MediaRecorder();
    myAudioRecorder.setAudioSource(MediaRecorder.AudioSource.MIC);
    myAudioRecorder.setOutputFormat(MediaRecorder.OutputFormat.THREE_GPP);
    myAudioRecorder.setAudioEncoder(MediaRecorder.OutputFormat.AMR_WB);
    myAudioRecorder.setAudioSamplingRate(16000);
    myAudioRecorder.setAudioEncodingBitRate(16000);
    myAudioRecorder.setAudioChannels(1);
    myAudioRecorder.setOutputFile(outputFile);

Run Code Online (Sandbox Code Playgroud)

API 中 SpeechService 的 identifyInputStream() 函数：

mApi.recognize(
      RecognizeRequest.newBuilder()
              .setConfig(RecognitionConfig.newBuilder()
                      .setEncoding(RecognitionConfig.AudioEncoding.AMR_WB) //originally it was LINEAR16
                      .setLanguageCode("en-US")
                      .setSampleRateHertz(16000)
                      .build())
              .setAudio(RecognitionAudio.newBuilder()
                      .setContent(ByteString.readFrom(stream))
                      .build())
              .build(),
      mFileResponseObserver);

Run Code Online (Sandbox Code Playgroud)

谷歌编码指南：https : //cloud.google.com/speech/docs/best-practices

据我了解，我可以使用 AMR_WB 和 16kHz 而不是默认的 LINEAR16，我只是不确定我是否做得对。

小路

这是完全可用的示例（使用来自 repo 的音频文件）：

mSpeechService.recognizeInputStream(getResources().openRawResource(R.raw.audio));

Run Code Online (Sandbox Code Playgroud)

但是，即使使用完全相同的文件，以下选项都不起作用：

InputStream inputStream = new URL("[website]/test/audio.raw").openStream();
mSpeechService.recognizeInputStream(inputStream);

Run Code Online (Sandbox Code Playgroud)

两者都不：

Uri uri = Uri.parse("android.resource://[package]/raw/audio");
InputStream inputStream = …

Run Code Online (Sandbox Code Playgroud)

audio encoding android google-speech-api

jmm*_*jmm

2017 07-02

5
推荐指数

0
解决办法

963
查看次数

标签统计

android ×1

audio ×1

encoding ×1

google-speech-api ×1

如何正确地将音频文件发送到 Google Speech API？

编码

小路

标签 统计

小编jmm_jmm的帖子

标签统计