我可以在我的java程序中使用GATE http://gate.ac.uk/来提取命名实体.如果是的话,你能举一些例子或指导我参考吗?谢谢
小智 5
您的问题实际上有两个问题:如何使用GATE查找命名实体,以及如何将GATE嵌入到您的应用程序中.
命名实体识别或分类是一个巨大的研究领域,根据您想要找到的命名实体,不同的方法可能是最有效的.GATE提供了一个非常基本的地名词典列表和基于规则的方法,用于在英文文本中查找某些类别的命名实体:ANNIE.如果ANNIE找到的类别是您感兴趣的类别,一种方法可能是理解和改进ANNIE已经提供的内容.ANNIE管道将在您的文档中为Person,Organization等创建注释,您只需要使用或编写访问这些注释的PR,并使用这些注释的功能或文本执行您需要的任何操作.查看GATE手册http://gate.ac.uk/sale/tao/split.html它解释了ANNIE,还有一些关于如何嵌入GATE的文档(如何在不运行GUI的情况下直接从Java程序中使用GATE) .