use*_*782 5 audio signal-processing fft
我正在制作音乐可视化工具,我想为每种乐器显示不同的视觉元素.例如,代表声乐的蓝色条,代表吉他的红色条,代表鼓的黄色条等.
有没有办法分析FFT的结果来获取这些信息?
谢谢.
Spe*_*edy 12
这是一项挑战,是音乐技术研究的一个活跃领域.
这在一定程度上是可能的,但这肯定不容易.使用mp3会特别困难,因为许多重要信息在压缩时会丢失.
您要做的事情被称为音频源分离或声源分离.它追求将录音分离为其组成元素.
这些元素可以是语音(几个人同时说话 - "鸡尾酒会问题")或乐器(在录音'盲目分类'中将一种乐器与另一种乐器分开).
您可以采取各种方法,其中一些方法基于声音的频域特性,另一些则基于空间属性.
如果你试图分离低音鼓和长笛(即低频鼓的低频音箱是低音鼓和分配给长笛的高频箱),频域方法可能看起来相当简单.但实际上声音是很少整齐地分隔成有用的频率区域.例如,低音鼓将在频谱上向上具有谐波含量.因此,这些类型的解决方案在数学上非常复杂并且通常涉及统计建模.重物.
基于声音的空间属性的分离通常依赖于在记录之前每个源的位置的一些先验知识(这是"非盲").通常需要有一个以上的麦克风(至少是立体声录音).使用一些聪明的数学,可以基于每个麦克风处的信号关系,基于对空间源的位置的知识来分离源.这也是称为波束成形技术的基础,通过该技术可以使用麦克风阵列确定源的位置.
所以,回到正轨.人们正在尝试这样做,但它很复杂,使用mp3会让你的生活变得困难!
我担心我不太了解这些方法,但我可以找到一些参考资料来帮助你入门:
http://www.cs.tut.fi/~tuomasv/demopage.html
http://www.cs.northwestern.edu/~pardo/courses/eecs352/lectures/source%20separation.pdf(pdf警告!)
祝好运!
| 归档时间: |
|
| 查看次数: |
1638 次 |
| 最近记录: |