Librosa的采样率问题

Bas*_*asj 6 python audio signal-processing librosa

在进行STFT时,然后使用库Librosa对16位44.1 khz音频文件进行反向STFT(iSTFT):

import librosa

y, sr = librosa.load('test.wav', mono=False)
y1 = y[0,]
S = librosa.core.stft(y1)
z1 = librosa.core.istft(S, dtype=y1.dtype)
librosa.output.write_wav('test2.wav', z1, sr)
Run Code Online (Sandbox Code Playgroud)

输出只是一个22千赫兹的音频文件.为什么?librosa的采样率变化在哪里?

Rya*_*n M 11

librosa.load()功能启用目标采样,其中您导入的音频文件可以重新采样到关键字参数指定的目标采样率sr.

如果要使用原始采样率,则必须将目标采样率明确设置为无:sr=None.默认情况下,sr=22050这就是你输出〜22khz的原因.

举例来说:

默认设置 - 子采样到默认值22,050 Hz

In[51]: filename = librosa.util.example_audio_file()
In[52]: y1, sr1 = librosa.load(filename)
In[53]: print sr1
22050
Run Code Online (Sandbox Code Playgroud)

明确设置sr=None可确保保留原始采样

In[54]: y2, sr2 = librosa.load(filename,sr=None)
In[55]: print sr2
44100
Run Code Online (Sandbox Code Playgroud)

子采样到指定速率,16,000 Hz

In[56]: y3, sr3 = librosa.load(filename,sr=16000)
In[57]: print sr3
16000
Run Code Online (Sandbox Code Playgroud)

结果: 在此输入图像描述