描述 CoNLL 2003 NER 任务的可能标签列表是什么?

rom*_*inf 3 tags named-entity-recognition conll

我需要做一些NER。我发现DeepPavlov库可以做到这一点。

这是文档中的示例:

from deeppavlov import configs, build_model

ner_model = build_model(configs.ner.ner_ontonotes, download=True)
ner_model(['Bob Ross lived in Florida'])
>>> [[['Bob', 'Ross', 'lived', 'in', 'Florida']], [['B-PERSON', 'I-PERSON', 'O', 'O', 'B-GPE']]]
Run Code Online (Sandbox Code Playgroud)

我不明白所有这些标签的含义。据我从文档中了解到,它们采用 CoNLL 2003 NER 任务格式。

有人可以给我指出可能的标签列表以及 CoNLL 2003 NER 任务的描述吗?

com*_*com 5

对于 NER 任务,有一些常见类型的实体用作标签:

  • 人 (PER)
  • 组织(ORG)
  • 货币价值(MONEY)
  • 地缘政治实体,即国家、城市、州(GPE)

和许多其他人

此外,为了区分具有相同标签的相邻实体,许多应用程序使用 BIO 标签方案。这里B表示实体的开始,I代表“内部”,用于除第一个实体之外的所有组成该实体的单词,O表示实体不存在。

因此,在上面的示例中,B-PERSON表示人名以标记Bob开头,下一个标签I-PERSON表示Ross与前一个标签相关的实体。然后是O,这意味着live不属于任何实体, in也是如此,而Florida是地缘政治实体 (GPE)的乞求。

请告诉我这是否足够有帮助。