tf.audio.decode_wav如何获取其内容?

Rob*_*MSN 3 python tensorflow

我正在尝试使用将一些音频文件拉入Tensorflow tf.audio.decode_wav

我可以看到有人正在寻找在文档中提供更多信息的方法,但是没有人有任何示例说明应如何工作吗?

tf.audio.decode_wav(
 contents,
 desired_channels=-1,
 desired_samples=-1,
 name=None
)
Run Code Online (Sandbox Code Playgroud)

精氨酸:

  • 内容:字符串类型的张量。WAV编码的音频,通常来自文件。
  • wanted_channels:可选的int。默认为-1。所需的样本通道数。
  • wanted_samples:可选的int。默认为-1。请求的音频长度。
  • name:操作名称(可选)。

我猜内容是已经从文件而不是路径中拉出的张量?

Sha*_*rky 5

您是对的,tf.audio.decode_wav()需要张量。您可以提供一种tf.io.read_file()将wav文件读入字符串类型的张量的函数 。

raw_audio = tf.io.read_file(filename)
waveform = tf.audio.decode_wav(raw_audio)
Run Code Online (Sandbox Code Playgroud)