我正在尝试为多标签分类问题构建神经网络。
情况
在输入图像中可能有多个输出类(并且它们不是相互排斥的)。共有6个班级。
例子
图 1 中包含第 1 类、第 2 类和第 5 类。因此,输出看起来像这样 [1, 1, 0, 0, 1, 0]。
数据不平衡问题
根据出现在该图像类型中的类的组合,我总共有 32 个独特类型的图像。因此,一种类型可以包含所有类(由 [1, 1, 1, 1, 1, 1] 表示),而另一种类型可能没有任何类(由 [0, 0, 0, 0 表示) , 0, 0])。
与其他图像(例如不存在类的图像)相比,某些图像非常罕见(例如包含第 1 类、第 3 类、第 4 类和第 6 类的图像)。从下面给出的数据中应该可以清楚地看出这一点。
Image Type : No. of samples of that image type
[1, 0, 1, 1, 0, 1] : 1
[1, 0, 1, 0, 1, 1] : 2
[1, 1, 1, 0, 1, …Run Code Online (Sandbox Code Playgroud)