如何在OpenNLP中通过NER识别印度名字?

Sag*_*tel 5 java named-entity-recognition opennlp

我使用OpenNLP模型进行名称 - 实体识别,但问题是它只能识别美国和英国的名字(外国名字),所以我需要识别印度名字.

这怎么可能?

Pet*_*ris 0

NER 解决方案往往是特定于领域的,使用硬编码单词列表作为信号(特征)和/或命名实体的内部字母结构。

英国/美国的名字彼此相似,也与其他欧洲名字相似,因为许多流行的美国名字和姓氏都来自非英语的欧洲移民。印度人的名字有很大不同,常用的名字/姓氏列表和训练数据语料库通常不包含太多或任何印度特有的数据。

为了解决您的问题,您需要根据适合您特定领域的数据来训练专门的 NER 模型。