Mar*_*hac 1 java nlp named-entity-recognition stanford-nlp ner
通过CoreNLP库,在调用ner()一个CoreLabel我收到一个字符串,指示其命名实体标签(如PERSON或DATE).
但是,我知道无法在一个句子中相互比较令牌.例如:(用反引号包围的标记文本)
`Ellen` PERSON
`Wexler `PERSON
`,` O
`February` DATE
`9` DATE
`,` DATE
`2016` DATE
Run Code Online (Sandbox Code Playgroud)
通过CoreNLP,如何组合人员标签以获取名称Ellen Wexler?或者为了得到日期标签February 9, 2016,或者我最终可以变成Java中的日期/日历对象的另一种表示?我看过这里给出的例子,但是只找到每个核心标签的ner标签.它没有为我提供一种将连续的,相同的ner标签组合在一起的方法.
我试过的:
我写了一个for循环,迭代句子并找到X个连续的,相同的ner标签(所以如果X是2而ner标签是PERSON,它会找到2个连续的PERSON).在这种情况下,就是这样Ellen Wexler.然而,当标点符号发挥作用时,这会打破,因为标点符号(取决于上下文)被赋予其相邻标记的ner标记.此外,必须通过CoreNLP实现此目的.
我的研究: 这个类似的问题尚未得到解答.CoreNLP主页没有提供任何答案,因为它仅提供了有关各个核心标签/令牌分析的示例.
传统上你更想使用entitymentions注释器.
在刚刚发布测试版的3.9.0中,ner注释器将自动创建实体提及,这些实体提及将属于同一实体提及的令牌链接在一起.
您可以查看新API的一些示例用法,以了解如何轻松访问实体提及.这个类的一些功能不在网站的3.9.0测试版中,但很快就会在更新版本中添加.
有用的演示代码:
| 归档时间: |
|
| 查看次数: |
602 次 |
| 最近记录: |