opennlp vs corenlp:市场范围 - 受欢迎程度

Shr*_*hya 3 parsing nlp stanford-nlp opennlp

我正在进行开源NLP工具的比较研究,并了解openNLP和coreNLP引擎的特性/服务.在最近的过去,我看到没有为openNLP论坛做出贡献,因为coreNLP论坛仍然活跃.所以我想了解stanford:coreNLP是否已经变得更受欢迎并被广泛用于商业应用?有人对此有所了解吗?

小智 7

Apache OpenNLP正在积极开发中.看看提交历史[1],不同的贡献者几乎每天都会做出提交,他们今年裁减了四个版本(1.7.0,1.7.1,1.7.2,最近只有1.8.0).

OpenNLP是在公司友好的Apache License 2.0下获得许可的,而CoreNLP是根据GPL许可的,很难在商业软件中使用(例如,分发的软件也必须在GPL下发布),但它们正在销售商业许可.

OpenNLP主要由在其生产系统中运行的公司开发,其中CoreNLP由斯坦福大学的研究人员制作.

CoreNLP有很多依赖项,它们被引入您的项目,其中OpenNLP没有依赖项.

OpenNLP可以为您提供以下任务:

  • 句子检测
  • 符号化
  • 分块
  • 命名实体识别
  • Pos标记
  • 解析
  • 词干
  • 语言模型
  • 词形还原
  • 文件分类

OpenNLP具有高度可定制性,易于培训用户数据,支持许多公开语料库的培训,并具有内置评估功能,可用于衡量每个组件的性能.

CoreNLP支持以下任务:

  • 句子检测
  • 符号化
  • 命名实体识别
  • Pos标记
  • 解析(也是依赖解析)
  • 情绪
  • 同指
  • 词形还原
  • 关系提取

[1] https://github.com/apache/opennlp/commits/master