我正在构建一个自定义 NER 模型,使用包含 98k 个产品及其相应标题的大小合适的数据集来检测产品标题中的品牌,该列车包含大约 84k 条记录、验证分割 10k 和测试分割 3k。该数据集的唯一问题是 89% 的产品标题都将品牌作为第一个单词。
当从头开始训练 NER 模型时,它在几个时期后就给出了 85% 的良好 F1 分数(批量大小 = 32),但是在测试模型时我注意到以下情况:
我的想法是通过重新采样数据集并从某些标题中删除一些品牌作为第一个单词并将其放在末尾或中间来解决这个问题。
但是,我想知道 NLP 中是否有一种技术可以让模型不那么重视文本中的实体位置?我使用了 0.6 的 dropout 但没有成功