使用python-nltk请求Anaphora解析示例

CCG*_*CCG 4 python nltk

我一直在寻找进入HOWTO的NLTK,DRT和成模块定义nltk.sem.drt,但我有一个很艰难的时间去了解如何使用这些包来实现的基本功能.

我想要实现的任务的一个例子如下:给出句子

谷歌是最大的科技公司之一.它雇用了很多人.

我希望能够编写一个小函数来解析这样的句子,并返回一个句子,如

谷歌是最大的科技公司之一.谷歌员工很多人.

更现实的测试用例可能就像

汤姆,迪克和哈利被邀请参加她的聚会,但拒绝了.这让雪莉很生气.

正在解决

汤姆,迪克和哈利被邀请参加雪利酒派对,但拒绝了.这让雪莉很生气.

jus*_*alf 11

我不认为DRT(话语表征理论)处理回指分辨率,就像你想要的那样.它涉及在形式逻辑中表示句子的含义.

此外,还有一个名为"更现实的测试用例"的名称,称为" cataphora ".

回指分辨率很难,但你可以尝试斯坦福DCoref

并在此处查看一些示例:使用Stanford Coref的Anaphora解决方案