小编Dha*_*MEN的帖子

如何在 Keras 中使用 CNN 处理多标签分类的不平衡数据?

我的数据集形状是 (91149, 12)

我使用 CNN 在文本分类任务中训练我的分类器

我发现培训准确度:0.5923和测试准确度:0.5780

我的班级有 9 个标签,如下所示:

df['thematique'].value_counts()
Corporate                   42399
Economie collaborative      13272
Innovation                  11360
Filiale                      5990
Richesses Humaines           4445
Relation sociétaire          4363
Communication                4141
Produits et services         2594
Sites Internet et applis     2585
Run Code Online (Sandbox Code Playgroud)

模型结构:

model = Sequential()
embedding_layer = Embedding(vocab_size, 300, weights=[embedding_matrix],   input_length=maxlen   ,   trainable=False)
model.add(embedding_layer)
model.add(Conv1D(128, 7, activation='relu'))
model.add(GlobalMaxPooling1D())
model.add(Dense(9, activation='sigmoid'))
model.compile(optimizer='Adam', loss='categorical_crossentropy', metrics= ['categorical_accuracy'])
Run Code Online (Sandbox Code Playgroud)

我的多标签分类数据不平衡。我需要在 Keras 中使用 CNN 处理多页分类的不平衡数据。

python multilabel-classification keras imbalanced-data

5
推荐指数
1
解决办法
1142
查看次数