我想获取音频PCM数据并在其中找到峰值.具体来说,我想返回峰值出现的频率和时间.
我对此的理解是我必须将PCM数据转储到一个数组中,将其设置为实数值,将复杂的部分设置为0.然后我接受FFT,然后得到一个数组.如果数组中的每个数字都是一个幅度值,我如何获得与每个数字相关的频率?另外,我是否考虑了真实和复杂部分的大小或者只是丢弃了复杂的值?
最后,如果我想在一首歌中找到峰值,我是否只需设置一个小窗口进行FFT并将其滑过所有音频?有关该窗口应该有多大的任何建议?
我在我的机器上运行了一堆屏幕会话,但所有屏幕会话都是分离且不需要的.有没有一种方法可以关闭所有这些,所以当我输入"screen -ls"时我什么都没有?