tf.audio.decode_wav如何获取其内容？

Question

我正在尝试使用将一些音频文件拉入Tensorflow tf.audio.decode_wav。

我可以看到有人正在寻找在文档中提供更多信息的方法，但是没有人有任何示例说明应如何工作吗？

tf.audio.decode_wav(
 contents,
 desired_channels=-1,
 desired_samples=-1,
 name=None
)

精氨酸：

我猜内容是已经从文件而不是路径中拉出的张量？

Answer 1

您是对的，tf.audio.decode_wav()需要张量。您可以提供一种tf.io.read_file()将wav文件读入字符串类型的张量的函数。

raw_audio = tf.io.read_file(filename)
waveform = tf.audio.decode_wav(raw_audio)