我正在尝试使用 numpy、struct 等各种模块在 python 中处理音频文件。但我真的很难检测文件中的静音,例如静音的位置。我遇到的方法之一是在我的音频信号上滑动一个固定时间间隔的窗口并记录平方元素的总和。我是 python 的新手,几乎不知道它,因此无法实现这个方法。
python audio
audio ×1
python ×1