如何使用HTML5 Audio API播放从XMLHTTPRequest返回的音频

exi*_*uio 6 javascript text-to-speech node.js html5-audio ibm-watson

在向服务器端API发出"AJAX"请求时,我无法播放音频.

我有后端Node.js代码,它使用IBM的Watson Text-to-Speech服务来提供来自文本的音频:

var render = function(request, response) {
    var options = {
        text: request.params.text,
        voice: 'VoiceEnUsMichael',
        accept: 'audio/ogg; codecs=opus'
    };

    synthesizeAndRender(options, request, response);
};

var synthesizeAndRender = function(options, request, response) {
    var synthesizedSpeech = textToSpeech.synthesize(options);

    synthesizedSpeech.on('response', function(eventResponse) {
        if(request.params.text.download) {
            var contentDisposition = 'attachment; filename=transcript.ogg';

            eventResponse.headers['content-disposition'] = contentDisposition;
        }
    });

    synthesizedSpeech.pipe(response);
};
Run Code Online (Sandbox Code Playgroud)

我有客户端代码来处理:

var xhr = new XMLHttpRequest(),
    audioContext = new AudioContext(),
    source = audioContext.createBufferSource();

module.controllers.TextToSpeechController = {
    fetch: function() {
        xhr.onload = function() {
            var playAudio = function(buffer) {
                source.buffer = buffer;
                source.connect(audioContext.destination);

                source.start(0);
            };

            // TODO: Handle properly (exiquio)
            // NOTE: error is being received
            var handleError = function(error) {
                console.log('An audio decoding error occurred');
            }

            audioContext
                .decodeAudioData(xhr.response, playAudio, handleError);
        };
        xhr.onerror = function() { console.log('An error occurred'); };

        var urlBase = 'http://localhost:3001/api/v1/text_to_speech/';
        var url = [
            urlBase,
            'test',
        ].join('');

        xhr.open('GET', encodeURI(url), true);
        xhr.setRequestHeader('x-access-token', Application.token);
        xhr.responseType = 'arraybuffer';
        xhr.send();
    }
}
Run Code Online (Sandbox Code Playgroud)

后端返回我期望的音频,但我的成功方法playAudio永远不会被调用.相反,始终调用handleError,并且错误对象始终为null.

任何人都可以解释我做错了什么以及如何纠正这个问题?这将不胜感激.

谢谢.

注意:URL中的字符串"test"将成为后端的文本参数,并最终位于synthesizeAndRender的options变量中.

Eri*_*ton 12

遗憾的是,与Chrome的HTML5音频实施不同,Chrome的网络音频不支持audio/ogg; codecs = opus,这是您的请求在此处使用的内容.您需要设置格式才能audio/wav使其正常工作.为了确保它传递给服务器请求,我建议将它放在查询字符串(accept=audio/wav,urlencoded)中.

您只是想播放音频,还是需要访问Web Audio API进行音频转换?如果您只需要播放音频,我可以向您展示如何使用HTML5音频API(而非Web音频API)轻松播放.而随着HTML5音频,您可以使用下面的技术可以流呢,而且你可以使用的最佳audio/ogg;codecs=opus格式.

它就像动态设置音频元素的源一样简单,通过以下方式从DOM查询:

(用HTML格式)

<audio id="myAudioElement" />
Run Code Online (Sandbox Code Playgroud)

(在你的JS中)

var audio = document.getElementById('myAudioElement') || new Audio();
audio.src = yourUrl;
Run Code Online (Sandbox Code Playgroud)

您还可以通过XMLHttpRequest设置音频元素的源,但是您不会获得流式传输.但由于您可以使用POST方法,因此您不限于GET请求的文本长度(对于此API,大约6KB).要在xhr中设置它,可以从blob响应创建数据uri:

    xhr.open('POST', encodeURI(url), true);
    xhr.setRequestHeader('Content-Type', 'application/json');
    xhr.responseType = 'blob';
    xhr.onload = function(evt) {
      var blob = new Blob([xhr.response], {type: 'audio/ogg'});
      var objectUrl = URL.createObjectURL(blob);
      audio.src = objectUrl;
      // Release resource when it's loaded
      audio.onload = function(evt) {
        URL.revokeObjectURL(objectUrl);
      };
      audio.play();
    };
    var data = JSON.stringify({text: yourTextToSynthesize});
    xhr.send(data);
Run Code Online (Sandbox Code Playgroud)

如您所见,使用XMLHttpRequest,您必须等到数据完全加载才能播放.有可能是一种方式,从XMLHttpRequest来流使用非常新媒体来源扩展API,这是目前仅适用于Chrome和IE(无火狐或Safari)可用.这是我正在尝试的方法.如果我成功,我会在这里更新.