我想使用 Azure 语音服务批量转录 API来创建音频文件的转录。我已经成功使用语音服务 SDK(适用于 Node.js),但有兴趣尝试 v3.1 预览版 api ( displayFormWordLevelTimestampsEnabled) 中提供的较新功能之一,所以我想我必须使用REST API 服务来执行此操作。
总的来说,我的问题是,无论我为Create TranscriptAPI提供什么输入contentUrls,我总是会得到相同的错误:
"error": {
"code": "InvalidData",
"message": "The recordings URI contains invalid data."
}
Run Code Online (Sandbox Code Playgroud)
经过一番挖掘后,我通过 Azure 门户找到了一些提示,可用于以sox请求的特定格式处理音频文件的转码。
他们在门户文档中提到的具体格式显示:如果您使用 REST API,请确保它使用此表中的格式之一:
| 格式 | 编解码器 | 比特率 | 采样率 |
|---|---|---|---|
| 音频格式 | 相变材料 | 256kbps | 16 kHz,单声道 |
| 奥格 | 奥普斯 | 256kbps | 16 kHz,单声道 |
sox 的具体命令是:
| 活动 | SoX命令 |
|---|---|
| 检查音频文件格式。 | 红袜--我 |
| 将音频文件转换为单声道、16 位、16 KHz。 | sox -b 16 -e 有符号整数 -c 1 -r 16k -t wav .wav |
我通过第二个命令运行我的 mp3 …