使用NER注释文本:异常:无法读取TokensRegexNER

Kon*_*nos 4 stanford-nlp

我正在尝试使用Java中的Stanford CoreNLP v3.9.1注释文本。使用的注释器是:标记化,分割,pos,引理,ner

我已经从https://stanfordnlp.github.io/CoreNLP/download.html包含了模型jar 。这两个英语模型都包含在我的项目中(正常+ kbp)。

但是,加载english.muc.7class.distsim.crf.ser.gz分类器后,将引发以下异常:Couldn't read TokensRegexNER from edu/stanford/nlp/models/kbp/regexner_caseless.tab

打开下载jar模型后stanford-english-kbp-corenlp-2018-02-27-models.jar,正确的路径regexner_caseless.tabedu/stanford/nlp/models/kbp/english/regexner_caseless.tab(注意english子路径)。

如何使Stanford CoreNLP使用正确的路径?

Sta*_*elp 5

您缺少该发行版随附的主要模型jar。

stanford-corenlp-2018-02-27-models.jar