Python音频帧音高变化

Leb*_*Wow 4 python audio pitch

我正在尝试使用pyaudio制作语音掩码.按照我现在设置的方式,我唯一需要做的就是输入声音,动态改变音高,然后将其重新排出.第一部分和最后一部分正在发挥作用,我认为我正在接近改变音调......强调"思考".

不幸的是,我不太熟悉我正在使用的数据类型以及如何以我想要的方式操作它.我已经阅读了audioop文档并且没有找到我需要的东西(认为我可以肯定在那里使用一些东西).我想我要问的是......

如何在这些音频帧中格式化数据.

如何改变画面的音高(如果可以的话),或者它是否接近这样的工作?

import pyaudio
import sys
import numpy as np
import wave
import audioop
import struct

chunk = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 41000
RECORD_SECONDS = 5

p = pyaudio.PyAudio()

stream = p.open(format = FORMAT,
                channels = CHANNELS,
                rate = RATE,
                input = True,
                output = True,
                frames_per_buffer = chunk)

swidth = 2

print "* recording"



while(True):

    data = stream.read(chunk)
    data = np.array(wave.struct.unpack("%dh"%(len(data)/swidth), data))*2

    data = np.fft.rfft(data)
    #MANipulation
    data = np.fft.irfft(data)



    stream.write(data3, chunk)




print "* done"

stream.stop_stream()
stream.close()
p.terminate()
Run Code Online (Sandbox Code Playgroud)

mtr*_*trw 5

irfft在行之后,在行之前stream.write,您需要通过struct.pack调用将数据转换回16位整数.

data = np.fft.irfft(data)
dataout = np.array(data*0.5, dtype='int16') #undo the *2 that was done at reading
chunkout = struct.pack("%dh"%(len(dataout)), *list(dataout)) #convert back to 16-bit data
stream.write(chunkout)
Run Code Online (Sandbox Code Playgroud)