rom*_*inf 3 tags named-entity-recognition conll
我需要做一些NER。我发现DeepPavlov库可以做到这一点。
这是文档中的示例:
from deeppavlov import configs, build_model
ner_model = build_model(configs.ner.ner_ontonotes, download=True)
ner_model(['Bob Ross lived in Florida'])
>>> [[['Bob', 'Ross', 'lived', 'in', 'Florida']], [['B-PERSON', 'I-PERSON', 'O', 'O', 'B-GPE']]]
Run Code Online (Sandbox Code Playgroud)
我不明白所有这些标签的含义。据我从文档中了解到,它们采用 CoNLL 2003 NER 任务格式。
有人可以给我指出可能的标签列表以及 CoNLL 2003 NER 任务的描述吗?
对于 NER 任务,有一些常见类型的实体用作标签:
和许多其他人
此外,为了区分具有相同标签的相邻实体,许多应用程序使用 BIO 标签方案。这里B表示实体的开始,I代表“内部”,用于除第一个实体之外的所有组成该实体的单词,O表示实体不存在。
因此,在上面的示例中,B-PERSON表示人名以标记Bob开头,下一个标签I-PERSON表示Ross与前一个标签相关的实体。然后是O,这意味着live不属于任何实体, in也是如此,而Florida是地缘政治实体 (GPE)的乞求。
请告诉我这是否足够有帮助。