如何使用Web Audio API获取原始的PCM音频？

Question

如何使用Web Audio API获取原始的PCM音频？

jeo*_*o.e 6 javascript audio mediastream web-audio-api

usergetmedia如何在Chrome中使用麦克风，然后流式传输以获取原始音频？我需要获得线性16的音频。

Answer 1

我发现的唯一两个清晰且有意义的例子如下：

AWS 实验室：https : //github.com/awslabs/aws-lex-browser-audio-capture/blob/master/lib/worker.js

AWS 资源非常好。它向您展示了如何将录制的音频导出为“编码为 PCM 的 WAV 格式”。Amazon Lex 是 AWS 提供的一项转录服务，它要求音频经过 PCM 编码并包装在 WAV 容器中。您只需修改一些代码即可使其适合您！AWS 有一些附加功能，例如“下采样”，它允许您在不影响录制的情况下更改采样率。

RecordRTC：https : //github.com/muaz-khan/RecordRTC/blob/master/simple-demos/raw-pcm.html

RecordRTC 是一个完整的库。您可以再次调整他们的代码或找到将音频编码为原始 PCM 的代码片段。您还可以实现他们的库并按原样使用代码。将此库的音频配置使用“desiredSampleRate”选项会对录音产生负面影响。

它们都是极好的资源，您一定能够解决您的问题。

这里列出了一些支持 WebAudioAPI 到原始 PCM 音频的库：/sf/answers/4048647151/ (2认同)

Answer 2

Bra*_*rad 8

不幸的是，MediaRecorder 不支持原始 PCM 捕获。（在我看来，这是一个可悲的疏忽。）因此，您需要获取原始样本并自己缓冲/保存它们。

您可以使用ScriptProcessorNode执行此操作。通常，此节点用于以编程方式修改音频数据，用于自定义效果等等。但是，您没有理由不将其用作捕获点。未经测试，但试试这样的代码：

const captureNode = audioContext.createScriptProcessor(8192, 1, 1);
captureNode.addEventListener('audioprocess', (e) => {
  const rawLeftChannelData = inputBuffer.getChannelData(0);
  // rawLeftChannelData is now a typed array with floating point samples
});

Run Code Online (Sandbox Code Playgroud)

（您可以在MDN上找到更完整的示例。）

这些浮点样本以零为中心，0理想情况下将绑定到-1和1。转换为整数范围时，您需要将值限制在此范围内，剪掉超出范围的任何内容。（这些值有时会超过-1，1如果大声的声音在浏览器中混合在一起。理论上，浏览器还可以从外部声音设备记录 float32 样本，这也可能超出该范围，但我不知道任何浏览器/ 执行此操作的平台。）

转换为整数时，值是有符号还是无符号很重要。如果有符号，对于 16 位，范围是-32768到32767。对于无符号的，它是0对65535。找出您要使用的格式并将-1to1值缩放到该范围。

关于此转换的最后一个说明……字节顺序很重要。另见：https : //stackoverflow.com/a/7870190/362536

Answer 3

小智 0

您应该查看MediaDevices.getUserMedia() API 的 MediaTrackConstraints.sampleSize属性。使用该约束，如果您的音频硬件允许，您可以将样本大小设置为 16 位。sampleSize

就实施而言，这就是链接和谷歌的用途......

欢迎来到 StackOverflow。在给出答案时，最好在答案中添加一些相关的示例代码。如果您只是提供链接，则可以将其保留为对该问题的评论。无论如何，对于这个问题，捕获位深度并不重要，因为 Web Audio API 始终提供浮点样本。此外，您会发现所有东西（也许除了某些专用嵌入式硬件）都支持 16 位音频。 (3认同)

归档时间：	7 年，9 月前
查看次数：	2892 次
最近记录：	7 年，3 月前