求引文解析器

Mik*_*lov 5 java parsing text citations

我需要一个解析器来扫描学术文本,提取引文,并将这些引用解析为它们的组成部分(作者,标题,出版日期等).

我尝试过Paracite,但速度慢得令人沮丧,并没有产生高质量的结果.

任何语言都可以,但Java是首选.

NPE*_*NPE 5

看看ParsCit

这是 ParsCit 项目的主页,它执行两个任务:1) 引用字符串解析,有时也称为引文解析或引文提取,以及 2) 科学文档的逻辑结构解析。它被构建为使用条件随机场作为其学习机制的监督机器学习过程。您可以下载下面的代码、在线解析字符串或将批处理作业发送到我们的网络服务。该代码包含训练数据、特征生成器和 shell 脚本,用于将系统连接到网络服务(在本网站上使用)。