jba*_*low 13
这里概述的许多答案涉及常见的音频测量,例如THD + N,SNR等.然而,这些并不总是与人类对音频伪像的听觉相关.有损音频压缩技术通常通过增加 THD + N和SNR 来起作用,但是旨在以人耳难以检测的方式这样做.更传统的音频测量技术可能会发现某个频段的SNR降低,但是如果相邻频段中的能量如此之多以至于没有人会注意到这种差异,那么这是否重要?
题为" 基于心理声学声音表示的感知音频质量测量 "的研究论文概述了一种基于耳朵听到的模型来量化人耳检测可听差异的能力的算法.它涉及与人类所感知的音频质量相关的因素.本文包括一项研究,将他们的算法结果与主观双盲测试进行比较,让您了解他们的模型是如何运作的.
我找不到这篇论文的免费副本,但是一个像样的大学图书馆应该把它存档.
实现该算法需要一些频域中的音频信号处理知识.具有DSP经验的本科生应该能够实施它.如果您没有参考波形,可以使用本文中的信息来量化令人反感的伪像.
该算法适用于PCM音频,最好是时间对齐的,当然不需要知道文件类型或标题.
小智 9
我不是软件开发人员(我是音频工程师),你用mp3算法压缩时听到的是: - 低频率:所以你可以检查更高范围的能量损失 - 失真的立体声:所以你可以制作一个Mid/Side矩阵,并检查Side中的THD - 相位相干性:也许你可以用相关计来检查
希望它有所帮助,对于计算机来说这是一项艰巨的任务!
首先,我不是音频工程师,但我一直试图保持联系音频压缩,因为我有一个很大的mp3收集,我有一些想法分享这个主题.
从人的角度来看,您所寻求的音质是否最佳?如果是这样,你不能用"客观手段"来衡量,比如比较眼镜等.
如果一个眼镜是丑陋的,它并不一定意味着质量很糟糕.重要的是,如果有人能够将编码文件与进行盲测的原始资源区分开来.期.如果要检查编码音轨的质量,则必须进行盲ABX测试.
LAME(以及所有其他类型的有损MP3,AAC,AC3,DTS,ATRAC ......压缩器)都是所谓的感知编码器.它利用了关于人类音频感知性质的某些事实.因此,您不能仅仅依靠频谱图来评估其质量.
现在,如果您的目标来自客观方式/观点,您可以使用EAQUAL,它代表音频质量评估:
它是一种客观测量技术,用于测量编码/解码音频文件的质量(与PEAQ非常相似)
(......)
然而,当使用客观测试方法时,结果仍然没有结果,并且大多数仅供编解码器开发人员和研究人员使用.
......或弗里德曼统计分析工具.
(...)对数据集进行多次统计分析,特别适合收听测试数据.
我不是说频谱分析仪没用.这就是我发布一些实用程序的原因.我只是说要小心所有这些统计方法:正如Hydrogenaudio社区的某个人说过一次,你不要用眼睛听.(查看我发布的这个帖子,这是一个很好的资源).要从人的角度真实地证明音频质量,你应该测试耳朵而不是图形.
这是一个复杂的主题,恕我直言,我建议你寻找像Hydrogenaudio这样的专业音频社区.
如果我理解正确的话,你有一堆音频文件,它们以不同的格式开始,质量各不相同。它们都已转换为相同的格式,因此您无法使用标题来确定哪些最初是高质量的,哪些不是。
这是一个难题。可能有一些技巧可以捕获一些质量问题,但是检测从低比特率压缩算法(如 MP3)转换而来的内容将非常困难。
一些简单的技巧: