NATE的GATE有多好?

uza*_*yed 5 java nlp named-entity-recognition gate

我正在尝试构建一个本质上必须执行命名实体识别(NER)的NLP应用程序。我遇到了GATE。据我了解,这是构建NLP应用程序的框架。我测试了ANNIE,它是随GATE一起发布的IE系统,但我的域的NER结果未达到预期。实际上,任何NER(例如Stanford CoreNLP或NLTK)都没有给我所需的结果。因此,我决定调整现有系统以获得所需结果。

关于GATE,我喜欢几件事情:
1.组件的模块化:例如在ANNIE中,诸如Tokenizer,Gaztteer,Sentence splitter,POS标记器等组件可以彼此独立使用。
2.它的规则语言称为JAPE,它具有很好的编写规则或模式的方式。

但是我想了解的有关GATE的几件事是:
1. GATE的其他主要优势是什么,特别是对NER?
2. GATE添加新组件的灵活性如何?例如,某天是否要在GATE中使用NLTK的POS标记器?
3.如果我想在GATE中使用自定义机器学习模型?
4.我知道谢菲尔德大学的NLP小组参与了GATE,但是我想知道GATE社区的活跃程度以及对GATE的支持有多活跃?
5. GATE可以用于商业软件吗?

热衷于此的实际使用GATE的人的建议

小智 3

虽然晚了,但可能对某人有用。

  1. 正如您已经提到的,如果编写得当,JAPE 语法将非常有用。另外,我认为嵌入的 GATE 是另一大优势,因为我们可以在 JAVA 中调整我们想要的方式。
  2. 同样,GATE 嵌入式可用于添加新组件,您可以在其中构建自己的插件。但是,如果您想使用斯坦福大学的工具,GATE 中已经提供了这些工具。您可以即插即用。
  3. GATE 中已经有很多可用的算法,我猜他们(谢菲尔德大学)正在不断构建它。
  4. GATE支持团队非常活跃,您可以订阅他们的邮件列表并提出问题,他们会尽快回复。
  5. 大概吧。但是,如果您直接联系GATE 团队,他们会更好地回答您。