如何在NER模型和QA模型之间做出选择?

Jos*_*bel 2 python nlp extract named-entity-recognition transformer-model

我正在完成一项涉及 NLP 和 Transformer 的任务。我想识别文本语料库中的相关特征。如果我要从工作描述中提取相关特征,例如工作中将使用的工具(powerpoint、excel、java 等)以及所需的熟练程度,该任务是否更适合命名实体识别模型或问答模型。

如果我像 NER 任务一样处理它,我会给训练数据中的所有相关工具贴上标签,并希望它能很好地泛化。我可以像 QA 模型一样处理这个问题,并询问诸如“这项工作需要什么工具”之类的问题,并提供描述作为上下文。

我计划使用 Transformers 库,除非我缺少一个更好的工具来完成此任务。我希望提取许多功能,因此并非所有功能都像从列表中获取关键字(编程语言、微软 Office 等...)一样简单。

这些方法中的一种是否更适合,或者我是否缺少一种更好的方法来解决这个问题。

任何帮助表示赞赏。谢谢你!

Jin*_*ich 6

从你的说法来看,这似乎是一个实体识别任务。但是,您应该自己提出并回答的问题是:

\n
    \n
  • 您的用户将如何与模型交互?

    \n
      \n
    • 结构化信息\xe2\x86\x92 实体识别。
    • \n
    • 聊天机器人 \xe2\x86\x92 质量检查。
    • \n
    \n
  • \n
  • 您是否要从文本中提取一组预定义的实体?

    \n
      \n
    • 是\xe2\x86\x92实体识别。
    • \n
    • 没有 \xe2\x86\x92 质量检查。
    • \n
    \n
  • \n
  • 您用于微调的训练数据是什么样的?

    \n
      \n
    • 只有其中的几个 \xe2\x86\x92 实体识别。
    • \n
    • 大量数据,问答对\xe2\x86\x92 QA。
    • \n
    \n
  • \n
\n