构建一个python应用程序,在linux系统上使用sox将原始音频文件转换为wave.我希望它能够生成音频波形模式的图像(PNG或Jpeg),但我无法找到执行此操作的命令行工具或python包.不是体验Python程序员我的选择是有限的.
有几个Linux应用程序需要一个我没有的运行桌面(Gtk).这些都没用. http://www.baudline.com http://quickplot.sourceforge.net/
GnuPlot和Octave似乎只能制作光谱仪,这不是我想做的.
有任何想法吗?
我想在Linux中使用SOX混合音频。这是我的剧本。我是这个东西的初学者。
time sox --buffer 128000 --combine mix audio1.mp3 audio_recorded.wav -C 64.0 "./Mixed.mp3"
time ffmpeg -loglevel warning -i ./Output.wav -c:a libfdk_aac -b:a 64k -map 0:0 -f segment -segment_time 10 -segment_list ./Output.m3u8 -segment_format aac './stream%03d.aac'
cd ..
Run Code Online (Sandbox Code Playgroud)
但是结果是这样的。
sox FAIL formats: can't open input file `audio_recorded.wav': WAVE: RIFF header not found
real 0m0.003s
user 0m0.000s
sys 0m0.002s
Run Code Online (Sandbox Code Playgroud)
该audio_recorded.wav是Android的一个录制的音频文件。
[已删除的ANDROID代码:不再需要]
更新:我试图将我的录音机..set比特率和采样率修改为audio1.mp3。然后我尝试将其混合。现在发生了什么:
[root@app complete]# bash test_mix.sh
sox WARN mp3-util: MAD lost sync
sox WARN mp3-util: recoverable MAD error
sox WARN mp3-util: recoverable …Run Code Online (Sandbox Code Playgroud) 我有一个包含许多文件夹的目录,其中包含数百个.SPH文件.我需要将所有.SPH文件转换为.wav格式.我采用了以下代码:
Run Code Online (Sandbox Code Playgroud)cd %~dp0 mkdir converted FOR %%A IN (%*) DO sox -t raw -s -2 -r 22050 -c 2 %%A "converted/%%~nA.wav" pause
但是,它在Windows 7上没有任何作用.当我在一些文件夹中尝试CMD上的代码时,某些.SPH是:
sox*.SPH output.wav
它将所有*.SPH嵌入到output.wav文件中,这不是我想要的.我需要name1.SPH到name1.wav,name2.SPH到name2.wav
请帮忙.
任务是从音频录制的开始和结束按阈值消除静音。我使用此sox端口连接到iOS。 https://github.com/shieldlock/SoX-iPhone-Lib/
我发现命令行sox工具通过以下命令完成了我的任务:
sox in.wav out.wav silence 1 0.1 1% reverse silence 1 0.1 1% reverse
Run Code Online (Sandbox Code Playgroud)
(摘自此处:http : //digitalcardboard.com/blog/2009/08/25/the-sox-of-silence/)
但我无法将其翻译为iOS lib格式,如下所示:
sox_create_effect(sox_find_effect("silence"));
args[0] = "2000", assert(sox_effect_options(e, 1, args) == SOX_SUCCESS);
assert(sox_add_effect(chain, e, &in->signal, &in->signal) == SOX_SUCCESS);
Run Code Online (Sandbox Code Playgroud)
我需要为执行此任务提供哪些参数?
这是来自以下问题的跟进问题:wac到wav转换
我已将文件扩展名从.wac更改为.raw并使用以下命令:
sox -r 44100 -e unsigned -b 8 -c 1 input.raw output.wav
Run Code Online (Sandbox Code Playgroud)
这将转换为.wav文件,但是会严重扭曲声音,例如:

应该在以下位置:

有很大的不同,我似乎无法弄清楚我要去哪里。我也尝试了以下方法:
sox input.raw --bits 16 --encoding signed-integer --endian little
output.wav
Run Code Online (Sandbox Code Playgroud)
但是我得到以下信息:
sox FAIL格式:文件“ input.raw”的输入格式错误:未指定采样率
有谁知道一种设置采样率的方法,因此文件正确吗?
目前使用的命令是
`sox input.wav -G -t mp3 -r 16k test.mp3`
Run Code Online (Sandbox Code Playgroud)
但这是创建一个比特率为24.0 kbps的文件.
如何使输出文件的比特率达到16.0 kbps?
我正在尝试通过与SoX中的脉冲响应进行卷积来应用混响。下面的shell脚本正是我想要的:
#!/usr/bin/env bash
#
# Convolve audio file with and impulse response (IR)
#
# Usage:
#
# applyReverb.sh <ir.wav> <audio.wav> <output.wav>
# IR duration (needed for zero-padding to prevent SoX from cutting
# the resulting audio after applying the FIR filter
IR_DUR=`soxi -D $1`
# read IR from wav, resample it if necessary, make sure is mono
# and save it as plain text (.dat format in SoX). Also reduces gain
# to prevent clipping later
sox --norm=-10 -c …Run Code Online (Sandbox Code Playgroud) 我需要将mp3文件分成每个片段TIME秒.我试过了mp3splt,但如果输出不到1分钟,它对我不起作用.是否有可能做到:
sox file_in.mp3 file_out.mp3 trim START LENGTH
Run Code Online (Sandbox Code Playgroud)
当我不知道mp3文件LENGTH
我大约需要20,000个.wav文件(所有语音线路),从开始到结束都要消除静音。
“沉默”并不是纯粹的沉默,因此我需要设置一个阈值。
我还想在实际的声音/声音开始之前留下一点“静默”,以便对每个文件进行修剪,但原始静默的.X秒仍然保留。
我尝试了各种命令,但无法正确设置阈值。我已经看到很多关于此操作的互联网评论,因此我必须使用错误的命令。
我也想不出如何离开.X秒的沉默。
我认为sox可以做到这一点,或者至少可以做到?
谢谢。
我试图通过Sox为我的一个应用程序录制2个不同的麦克风.我目前只是在Mac终端上进行音频录制测试.但是,我只能通过一个麦克风获得音频.
我使用的sox命令是:
sox -b 32 -e unsigned-integer -r 96k -c 2 -d --clobber --buffer $((96000*2*10)) /tmp/soxrecording.wav trim 0 10
这给了我一个很好的.wav文件.
我有两个不同的usb麦克风,它们在声音/系统偏好设置中显示为2通道I/p.我尝试-c 4使用sox命令从两个麦克风录制.
sox -b 32 -e unsigned-integer -r 96k -c 4 -d --clobber --buffer $((96000*2*10)) /tmp/soxrecording.wav trim 0 10
但是,我得到一个警告说;
sox WARN formats: can't set 4 channels; using 2
我只能从一个usb麦克风获取音频.我一直试图摆弄并理解什么是错的,但任何提示都会非常有用.
sox ×10
audio ×4
linux ×3
mp3 ×2
wav ×2
batch-file ×1
c++ ×1
ios ×1
libsox ×1
macos ×1
microphone ×1
node.js ×1
objective-c ×1
python ×1
shell ×1
transcoding ×1