Dha*_*MEN 5 python multilabel-classification keras imbalanced-data
我的数据集形状是 (91149, 12)
我使用 CNN 在文本分类任务中训练我的分类器
我发现培训准确度:0.5923和测试准确度:0.5780
我的班级有 9 个标签,如下所示:
df['thematique'].value_counts()
Corporate 42399
Economie collaborative 13272
Innovation 11360
Filiale 5990
Richesses Humaines 4445
Relation sociétaire 4363
Communication 4141
Produits et services 2594
Sites Internet et applis 2585
Run Code Online (Sandbox Code Playgroud)
模型结构:
model = Sequential()
embedding_layer = Embedding(vocab_size, 300, weights=[embedding_matrix], input_length=maxlen , trainable=False)
model.add(embedding_layer)
model.add(Conv1D(128, 7, activation='relu'))
model.add(GlobalMaxPooling1D())
model.add(Dense(9, activation='sigmoid'))
model.compile(optimizer='Adam', loss='categorical_crossentropy', metrics= ['categorical_accuracy'])
Run Code Online (Sandbox Code Playgroud)
我的多标签分类数据不平衡。我需要在 Keras 中使用 CNN 处理多页分类的不平衡数据。
| 归档时间: |
|
| 查看次数: |
1142 次 |
| 最近记录: |