小编Abi*_*aul的帖子

NER 训练循环中的损失在 spacy 中并未减少

我正在尝试训练一种新的实体类型“HE INST”——识别大学。这是唯一的新标签。我有一份很长的原始文本文档。我对其运行 NER 并将实体保存到 TRAIN DATA,然后将新的实体标签添加到 TRAIN_DATA(我在重叠的地方进行了替换)。

训练循环的损失值恒定(所有 15 个文本约为 4000),单个数据的损失值约为 300。为什么会发生这种情况,如何正确训练模型。我有大约 18 个文本,其中有 40 个带注释的新实体。即使在所有迭代之后,模型仍然无法正确预测输出。

我没有对剧本做太多改动。刚刚添加了 en_core_web_lg、新标签和我的 TRAIN_DATA

我正在尝试从简历(CV)数据中标记机构:

这将是我在 TRAIN_DATA 中的文本之一:(太长的文本了)我有大约 18 个这样的文本连接起来形成 TRAIN_DATA

[("To perform better in my work each day. To increase my knowledge. To bring out my best by hardworking and improving my skills. To serve my parents and my family. To contribute my skills to my country. Marital ; Single Status Nationality \xe2\x80\x94: Indian Known . Parr . English, Malayalam, Hindi, Tamil Languages Hobby …
Run Code Online (Sandbox Code Playgroud)

python nlp deep-learning spacy

5
推荐指数
1
解决办法
4881
查看次数

标签 统计

deep-learning ×1

nlp ×1

python ×1

spacy ×1