小编Sha*_*ngh的帖子

如何获得多标签分类问题的样本权重和类权重?

我正在尝试为多标签分类问题构建神经网络。

情况

在输入图像中可能有多个输出类(并且它们不是相互排斥的)。共有6个班级。

例子

图 1 中包含第 1 类、第 2 类和第 5 类。因此,输出看起来像这样 [1, 1, 0, 0, 1, 0]。

数据不平衡问题

根据出现在该图像类型中的类的组合,我总共有 32 个独特类型的图像。因此,一种类型可以包含所有类(由 [1, 1, 1, 1, 1, 1] 表示),而另一种类型可能没有任何类(由 [0, 0, 0, 0 表示) , 0, 0])。

与其他图像(例如不存在类的图像)相比,某些图像非常罕见(例如包含第 1 类、第 3 类、第 4 类和第 6 类的图像)。从下面给出的数据中应该可以清楚地看出这一点。

Image Type         : No. of samples of that image type

[1, 0, 1, 1, 0, 1] : 1
[1, 0, 1, 0, 1, 1] : 2
[1, 1, 1, 0, 1, …
Run Code Online (Sandbox Code Playgroud)

python scikit-learn keras tensorflow

8
推荐指数
1
解决办法
867
查看次数

标签 统计

keras ×1

python ×1

scikit-learn ×1

tensorflow ×1