小编 An*_*s99的帖子

如何使用 Spacy 防止 NER 模型过度拟合实体位置

我正在构建一个自定义 NER 模型,使用包含 98k 个产品及其相应标题的大小合适的数据集来检测产品标题中的品牌,该列车包含大约 84k 条记录、验证分割 10k 和测试分割 3k。该数据集的唯一问题是 89% 的产品标题都将品牌作为第一个单词。

当从头开始训练 NER 模型时,它在几个时期后就给出了 85% 的良好 F1 分数(批量大小 = 32),但是在测试模型时我注意到以下情况:

  • 该模型强烈偏向于将标题的第一个单词预测为品牌
  • 当品牌作为第一个词出现时,该模型非常擅长检测品牌,但对于中间或结尾有品牌的标题来说,该模型就相当薄弱了。

我的想法是通过重新采样数据集并从某些标题中删除一些品牌作为第一个单词并将其放在末尾或中间来解决这个问题。

但是,我想知道 NLP 中是否有一种技术可以让模型不那么重视文本中的实体位置?我使用了 0.6 的 dropout 但没有成功

nlp named-entity-recognition spacy

5
推荐指数
0
解决办法
587
查看次数

标签 统计

named-entity-recognition ×1

nlp ×1

spacy ×1