我使用0.025s长Hamming窗口和32768点FFT(?)来计算44100Hz采样音频信号的频谱,这是我的困惑:
所以我的问题是会发生什么?
从这个令人敬畏的解释我得出结论,32768点FFT通常意味着它意味着1秒间隔,并且确实Voicebox的rfft函数(我使用的)提到它截断/将样本填充到N.所以我假设它填充了我的小的1103向量,0到32768长向量,能够计算FFT.
嗯,这真的发生了吗?这可以改善分辨率,虽然只有信号的前1/32是非零的吗?(好吧,我想是的,但我想确定,因为这出现在论文辩护上 - 我现在就得到了这个想法,写这篇文章).
感谢您的任何反馈.