没有任何配置或编码,哪些工具可以执行自动关系提取?

ber*_*436 1 nlp

我已经设计了一个系统来对特定的语料库进行自动关系提取,其中关系是事先不知道的.我想将我的系统与另一个进行自动关系提取的系统进行比较,以查看我的系统是否表现得更好(对于学术论文).我所知道的唯一这样的自动提取系统是混响.

混响系统的自述文件中,他们说混响是"设计用于Web规模的信息提取,其中目标关系不能提前指定,速度很重要." 我的系统比混响慢得多(我认为因为它解析句子并执行更深入的分析)所以我不确定比较是否有意义.我提取了更多关系,但比较有点不公平(因为我的系统计算密集程度更高).还有其他类似混响的系统可以进行自动关系提取吗?也许那些不是"为网络规模信息提取而设计"的系统更公平的竞争对手?

我知道NLTK会进行关系提取,但你必须提供一个特定的正则表达式粘合剂来绑定关系中的实体.

还有其他工具可供NLP从业者用来进行自动关系提取吗?

ber*_*436 6

在NLP研究领域,提取关系而不指定您正在寻找哪种关系称为"开放关系提取".

有一些领先的系统用于执行"开放式关系提取",其中一些可以"开箱即用"

  • 来自华盛顿大学的混响在输入文本和输出关系上运行
  • 来自马克斯普朗克研究所的PATTY提供了一系列从纽约时报和维基百科中提取的大型实验.您可以下载关系(请参阅链接中的"下载"部分) - 然后在您的语料库中grep它们.请注意,某些关系包含了部分语音标记,因此要匹配这些关系,您需要在语料库中找到语音部分(使用一些标记器,如NLTK),然后查看它们是否与PATTY中的文本模式匹配.
  • 阿尔伯塔大学的范例.

Filipe Mesquita撰写的"开放式关系提取的有效性和效率"一文调查了截至2013年秋季的一些尖端关系提取系统.