斯坦福CoreNLP错误的共指解决方案

azp*_*lic 0 nlp stanford-nlp

我仍然在玩斯坦福大学的CoreNLP,我在Coreference分辨率的非常简单的测试中遇到了奇怪的结果.

给出两句话:

酒店有一个大浴室.这很干净.

我希望句子2中的"It"可以被句子1的"浴室"或至少"大浴室"所共处.

不幸的是,它指向"酒店",在我看来是错误的.

有没有办法解决这个问题?我需要训练任何东西,还是应该开箱即用?

    Annotation a = getPipeline().getAnnotation("The hotel had a big bathroom. It was very clean.");

    System.out.println(a.get(CorefChainAnnotation.class));
Run Code Online (Sandbox Code Playgroud)

输出:

{1 = CHAIN1 - [句子1中的"酒店",句子2中的"它"],2 = CHAIN2 - [句子1中的"大浴室"]}

非常感谢您的帮助.

Gab*_*eli 5

与AI中的许多组件一样,斯坦福参考系统仅在一定精度下才是正确的.在共参照的情况下,该精度实际上相对较低(在0-100范围内的标准基准上约为60).为了说明问题的难度,请考虑以下明显相似的句子,并使用不同的共指判断:

酒店有一个大浴缸.这是非常昂贵的.