Jos*_*bel 2 python nlp extract named-entity-recognition transformer-model
我正在完成一项涉及 NLP 和 Transformer 的任务。我想识别文本语料库中的相关特征。如果我要从工作描述中提取相关特征,例如工作中将使用的工具(powerpoint、excel、java 等)以及所需的熟练程度,该任务是否更适合命名实体识别模型或问答模型。
如果我像 NER 任务一样处理它,我会给训练数据中的所有相关工具贴上标签,并希望它能很好地泛化。我可以像 QA 模型一样处理这个问题,并询问诸如“这项工作需要什么工具”之类的问题,并提供描述作为上下文。
我计划使用 Transformers 库,除非我缺少一个更好的工具来完成此任务。我希望提取许多功能,因此并非所有功能都像从列表中获取关键字(编程语言、微软 Office 等...)一样简单。
这些方法中的一种是否更适合,或者我是否缺少一种更好的方法来解决这个问题。
任何帮助表示赞赏。谢谢你!
从你的说法来看,这似乎是一个实体识别任务。但是,您应该自己提出并回答的问题是:
\n您的用户将如何与模型交互?
\n您是否要从文本中提取一组预定义的实体?
\n您用于微调的训练数据是什么样的?
\n