标签: signal-processing

注意起病检测

我正在开发一个系统来帮助音乐家进行转录.目的是在单个乐器单声道录音上执行自动音乐转录(它不一定是完美的,因为用户将在以后纠正错误/错误).这里有没有人有自动音乐转录的经验？或一般的数字信号处理？无论您的背景如何,都非常感谢任何人的帮助.

到目前为止,我已经研究了使用快速傅里叶变换进行音调检测,并且MATLAB和我自己的Java测试程序中的大量测试表明它足够快速和准确以满足我的需求.需要解决的任务的另一个要素是以乐谱形式显示制作的MIDI数据,但这是我现在不关心的事情.

简而言之,我正在寻找的是一种用于音符开始检测的好方法,即信号中新音符开始的位置.由于慢速开启可能很难正确检测,我最初将使用带有钢琴录音的系统.这也部分归因于我弹钢琴的事实,应该处于更好的位置以获得合适的录音进行测试.如上所述,该系统的早期版本将用于简单的单声道录音,根据未来几周取得的进展,可能会在稍后进行更复杂的输入.

audio signal-processing onset-detection

Ala*_*lan

2019 02-01

31
推荐指数

1
解决办法

2万
查看次数

俯仰检测的倒谱分析

我正在寻找从声音信号中提取音高.

IRC上的某个人刚刚向我解释了如何采用双FFT实现这一目标.特别:

采取FFT
取绝对值平方的对数(可以用查找表完成)
采取另一个FFT
取绝对值

我正在尝试使用vDSP

我无法理解我之前没有遇到过这种技术.我做了很多狩猎和提问; 几周值得.更重要的是,我无法理解为什么我没有想到它.

我试图用vDSP库实现这一目标.它看起来好像有处理所有这些任务的功能.

但是,我想知道最终结果的准确性.

我之前使用的技术是将单个FFT的频率区域扫描为局部最大值.当它遇到一个时,它使用一种狡猾的技术(自上次FFT以来的相位变化)来更准确地将实际峰值放置在箱内.

我担心这种精确度会因为我在这里介绍的技术而丢失.

我想这种技术可以在第二次FFT之后使用,以准确地得到基波.但有点看起来信息在第2步中丢失了.

由于这是一个潜在的棘手过程,有经验的人可以只看一下我正在做的事情并检查它的理智吗？

此外,我听说有一种替代技术涉及在相邻的箱子上安装二次方.这是否具有可比性？如果是这样,我会赞成它,因为它不涉及记住bin阶段.

所以,问题:

这种方法有意义吗？可以改进吗？
我有点担心"log square"组件; 似乎有一个vDSP函数可以做到这一点:vDSP_vdbcon.但是,没有迹象表明它会预先计算日志表 - 我认为它不会,因为FFT函数需要调用显式预计算函数并将其传递给它.而这个功能没有.
是否存在拾取谐波的危险？
是否有任何狡猾的方式使vDSP拉出最大值,最大的第一？
有人能指出我对这种技术的一些研究或文献吗？
主要问题:它足够准确吗？可以提高准确度吗？一位专家刚刚告诉我,准确性是不充分的.这是行的结束吗？

皮

PS当我想创建标签时,我很生气,但不能.:| 我已向维护人员建议SO跟踪尝试的标签,但我确信我被忽略了.我们需要vDSP标签,加速框架,倒谱分析

signal-processing fft detection pitch vdsp

P i*_*P i

2018 06-12

30
推荐指数

3
解决办法

2万
查看次数

混响算法

我正在寻找一个简单或评论的混响算法,即使在伪代码中也会有很多帮助.

我发现了一对,但代码往往相当深奥,很难遵循.

c++ signal-processing

Reu*_*Reu

2014 07-16

30
推荐指数

3
解决办法

3万
查看次数

和弦检测算法？

我正在开发依赖于音乐和弦检测的软件.我知道一些基于倒谱分析或自相关技术的音调检测算法,但它们主要关注单声道材料识别.但我需要使用一些复音识别,即同时进行多个音高,就像在和弦中一样; 有谁知道一些关于这个问题的好的研究或解决方案？

我目前正在开发一些基于FFT的算法,但如果有人对我可以使用的某些算法或技术有所了解,那将会有很大的帮助.

algorithm audio signal-processing music-notation

Nem*_*eth

2018 12-29

29
推荐指数

4
解决办法

2万
查看次数

使用Python估计自相关

我想对下面显示的信号执行自相关.两个连续点之间的时间是2.5ms(或400Hz的重复率).

在此输入图像描述

这是我想要使用的估计自相关的等式(取自http://en.wikipedia.org/wiki/Autocorrelation,部分估计):

在此输入图像描述

在python中查找我的数据估计自相关的最简单方法是什么？有什么类似于numpy.correlate我可以使用的东西吗？

或者我应该只计算均值和方差？

编辑:

在unutbu的帮助下,我写道:

from numpy import *
import numpy as N
import pylab as P

fn = 'data.txt'
x = loadtxt(fn,unpack=True,usecols=[1])
time = loadtxt(fn,unpack=True,usecols=[0]) 

def estimated_autocorrelation(x):
    n = len(x)
    variance = x.var()
    x = x-x.mean()
    r = N.correlate(x, x, mode = 'full')[-n:]
    #assert N.allclose(r, N.array([(x[:n-k]*x[-(n-k):]).sum() for k in range(n)]))
    result = r/(variance*(N.arange(n, 0, -1)))
    return result

P.plot(time,estimated_autocorrelation(x))
P.xlabel('time (s)')
P.ylabel('autocorrelation')
P.show()

Run Code Online (Sandbox Code Playgroud)

python signal-processing numpy

876*_*674

2017 05-23

29
推荐指数

4
解决办法

5万
查看次数

用于识别间距的.NET库

我想写一个简单的程序(最好是在C#中),我用麦克风唱一个音高,程序识别音高对应的音符.

非常感谢您的及时回复.我澄清一下:

我想要一个(最好是.NET)库来识别我唱的音符.我想要这样一个图书馆:

我唱歌时识别音符(半音音符).
告诉我,我离最近的音符有多远.

我打算用这样一个库一次唱一个音符.

.net c# signal-processing frequency-analysis

Ant*_*oni

2012 11-19

28
推荐指数

3
解决办法

1万
查看次数

什么是高通和低通滤波器？

图形和音频编辑和处理软件通常包含称为"高通滤波器"和"低通滤波器"的功能.究竟是做什么的,以及实现它们的算法是什么？

photoshop algorithm audio graphics signal-processing

Kri*_*son

2008 10-05

26
推荐指数

6
解决办法

8万
查看次数

实时音调检测

我正在尝试对用户唱歌进行实时音调检测,但我遇到了很多问题.我已经尝试了很多方法,包括FFT(FFT问题(返回随机结果))和自相关(自相关音调检测返回麦克风输入的随机结果),但我似乎无法获得任何方法来给出好的结果.任何人都可以建议一种实时音高跟踪方法或如何改进我已有的方法？我似乎无法找到任何好的C/C++方法进行实时音高检测.

谢谢,

尼尔.

编辑:请注意,我已经检查过麦克风输入数据是否正确,并且当使用正弦波时,结果或多或少是正确的音高.

编辑:对不起,这是迟到的,但此刻,我通过从结果数组和每个索引中取出值,并在X轴上绘制索引和在Y轴上绘制值来显示自动相关(两者都被除以100000或其他东西,我使用OpenGL),将数据插入VST主机并使用VST插件不是我的选择.目前,它看起来像一些随机点.我正确地做了,或者你能不能指点我做一些代码或者帮助我理解如何可视化原始音频数据和自相关数据.

audio signal-processing fft pitch-tracking pitch

Nia*_*all

2017 05-23

26
推荐指数

5
解决办法

5万
查看次数