我正在学习GATE和JAPE语法.这是我第一次使用GATE和JAPE语法.我正在学习本教程,其中给出了识别运动的语法.我使用了这个.jape文件和示例文本,但GATE无法识别除人员,组织,日期等之外的任何内容.
我想知道如何.jape在GATE中使用自定义语法?如果有人可以请你采取措施,那将是非常好的.
目前我正在做以下步骤:
启动GATE GUI.
加载带有默认值的ANNIE系统.
步骤(2)加载ANNIE POS Tagger,tokenizer,句子分割器等Processing Resources.
右键单击Processing Resources并选择New -> JAPE Transducer.
给.jape文件路径并给出一些名称.
右键单击Language Resources并选择New -> GATE Corpus.给语料库命名.
右键单击新创建的语料库并选择Populate.
选择存在文本文件的目录.我们想在这些文件上运行GATE.
双击节点ANNIE下方Applications,然后单击Run
This Application按钮.
一旦我点击Run This Application按钮,所有处理完成,我打开输入文本文件.
此文件没有任何标记写入.jape文件,它只显示正常标签,如人员,组织等.

我的.jape文件如下所示:
Phase:firstpass
Input: Lookup
Options: control = brill
Rule: SportsCategory
Priority: 20
(
{Lookup.majorType == "Sports"}
): label
-->
:label.Sport = {rule= "SportsCategory" }
Run Code Online (Sandbox Code Playgroud)
和输入文本文件如下:
Soccer - Rooney Gerrard - File .
Composite file picture of Liverpool 's Steven Gerrard (left , dated 27 September 2006 ) and Manchester United 's Wayne Rooney (dated 20 August 2006 ) . On the occasion of his 21st Birthday , Tuesday 24 October 2006 , Wayne Rooney has hailed England team -mate Steven Gerrard as one of the world 's best midfielders and wishes the Liverpool star could play at Manchester United .
Run Code Online (Sandbox Code Playgroud)
任何人都可以告诉我,如果我错过任何其他步骤.我无法找到一步一步的说明:(我希望GATE的人会花一些时间写这样的教程.
您的规则不会被解雇,因为带注释的文档中没有主要类型 Sports 的查找。
除非您在默认的 ANNIE 应用程序中添加了一些内容,否则我只是打开它,发现在默认的地名词典中只有一个主要类型为运动的文件,并且包含网球、游泳等内容,但没有足球。如果您使用基于规则的系统,您可能最终也会添加大量字典:)
一个好的做法是创建一个简单的测试文档,并按照 jape 规则运行管道(停止或排除此后的所有 PR),然后检查文档是否满足 LHS 先决条件。在你的情况下,应该有一个带有 MajorType sports 的查找。
我认为最好的 jape 分步教程可以在本培训材料中找到。但你已经明白了。