小编And*_*bin的帖子

很多文章都在使用 CNN 来提取音频特征。输入数据是具有时间和频率两个维度的频谱图。

创建音频频谱图时，您需要指定两个维度的确切大小。但它们通常不是固定的。可以通过窗口大小来指定频率维度的大小，但是时域呢？音频样本的长度不同，但CNNs的输入数据的大小应该是固定的。

在我的数据集中，音频长度范围从 1s 到 8s。填充或切割总是对结果影响太大。

7
推荐指数

1
解决办法

2163
查看次数

我是TensorFlow的新手.我正在使用自己的数据集进行二进制分类.但是我不知道如何计算准确度.有人可以帮我这么做吗？

我的分类器有5个卷积层,后面是2个完全连接的层.最终的FC层的输出维度为2,我使用过:

prob = tf.nn.softmax(classification_features, name="output")

6
推荐指数

1
解决办法

9024
查看次数

小编And_bin的帖子