当我从音频中提取 MFCC 时,输出为(13, 22). 数字代表什么?是时间范围吗?我用的是librosa。
(13, 22)
使用的代码是:
mfccs = librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=13, hop_length=256) mfccs print(mfccs.shape)
输出是(13,22).
(13,22)
python audio mfcc librosa
audio ×1
librosa ×1
mfcc ×1
python ×1