相关疑难解决方法(0)

如何在python中将音频文件(wav格式)拼接成1秒接头?

我正在寻找一个python函数将一个音频文件(wav格式)拼接成1秒的持续时间拼接,并将每个新拼接(持续时间为1秒)存储到一个新的.wav文件中.

python audio

6
推荐指数
1
解决办法
4885
查看次数

如何停用 OpenAI Whisper 对超过 30 秒的音频输入的标准化?(转录填充词)

OpenAI 的 Whisper 可以提供漂亮、干净的文字记录。现在我希望它能生成更多原始记录,其中还包含填充词(ah、mh、mhm、uh、oh 等)。这里的帖子告诉我,可以通过将标准化设置为 false: https: //huggingface.co/spaces/openai/whisper/discussions/30

我设法使用了这段代码,但我只得到了 30 秒的耳语转录。如何让它处理更长的音频文件?

请注意,我是一个耳语和Python的初学者。

到目前为止我所做的:我主要使用https://huggingface.co/spaces/openai/whisper/discussions/30中的代码因为我不想使用虚拟数据集,所以我使用 librosa 加载本地 mp3 。我想还有其他方法可以做到这一点,我对此持开放态度。

据我了解,指示耳语处理器对于停用标准化是必要的。因此,这里使用的不是耳语 ( import whisper) 而是耳语 via transformers。相关开关是normalize = False

我的代码(myscript.py):

from transformers import WhisperProcessor, WhisperForConditionalGeneration
import librosa

speech, _ = librosa.load("myaudio.mp3", sr=16000, mono=True)

processor = WhisperProcessor.from_pretrained("openai/whisper-large")
model = WhisperForConditionalGeneration.from_pretrained("openai/whisper-large")

model.config.forced_decoder_ids = processor.get_decoder_prompt_ids(language = "de", task = "transcribe")
input_features = processor(speech, return_tensors="pt", sampling_rate=16000).input_features 
predicted_ids = model.generate(input_features)
transcription = processor.batch_decode(predicted_ids, skip_special_tokens = True, normalize = False)

print(transcription)
Run Code Online (Sandbox Code Playgroud)

到目前为止效果很好。但是,仅转录前 30 …

python speech-recognition python-3.x openai-whisper

5
推荐指数
1
解决办法
1885
查看次数

按时间戳分解 .wav 文件

我是音频处理领域的新手。我有一组由语音解析程序生成的时间戳。我现在要做的是将完整的 wav 文件分解为由时间戳列表指定的片段。有人可以推荐一个我可以用于这项工作的 python 库吗?

python audio parsing wav

4
推荐指数
2
解决办法
8099
查看次数

使用 Python 只读取大型 wav 文件的一部分

我有很大的 wav 文件(每个大约 4GB)。由于我的部署服务器有一个限制,每个进程不能使用超过 500 MB 的 RAM,因此我希望能够仅加载和处理音频文件的块,然后稍后读取并附加它们,例如一个文本文件。

我查看了pydub,但它似乎会在我可以切掉较小的块进行处理之前加载整个文件(如果我错了,请纠正我)。scipy.io.wavfile.read的情况也是如此。我希望能够读取大文件的块,处理它们,然后将它们放回去(理想情况下附加到硬盘驱动器上先前处理的块)。

我能找到的大多数可用的答案已经假设我可以将大文件加载到主内存中。

如何将一个 .wav 文件拆分为多个 .wav 文件?

在Python中读取*.wav文件

audio python-3.x

2
推荐指数
1
解决办法
1983
查看次数