来自GATE教程网站的简单JAPE语法不起作用

She*_*har 5 grammar gate

我正在学习GATE和JAPE语法.这是我第一次使用GATE和JAPE语法.我正在学习教程,其中给出了识别运动的语法.我使用了这个.jape文件和示例文本,但GATE无法识别除人员,组织,日期等之外的任何内容.

我想知道如何.jape在GATE中使用自定义语法?如果有人可以你采取措施,那将是非常好的.

目前我正在做以下步骤:

  1. 启动GATE GUI.

  2. 加载带有默认值的ANNIE系统.

  3. 步骤(2)加载ANNIE POS Tagger,tokenizer,句子分割器等Processing Resources.

  4. 右键单击Processing Resources并选择New -> JAPE Transducer.

  5. .jape文件路径并给出一些名称.

  6. 右键单击Language Resources并选择New -> GATE Corpus.给语料库命名.

  7. 右键单击新创建的语料库并选择Populate.

  8. 选择存在文本文件的目录.我们想在这些文件上运行GATE.

  9. 双击节点ANNIE下方Applications,然后单击Run This Application按钮.

一旦我点击Run This Application按钮,所有处理完成,我打开输入文本文件.

此文件没有任何标记写入.jape文件,它只显示正常标签,如人员,组织等.

在此输入图像描述

我的.jape文件如下所示:

Phase:firstpass
Input:  Lookup  
Options: control = brill

Rule: SportsCategory
Priority: 20
(
{Lookup.majorType == "Sports"}
): label
-->
:label.Sport = {rule= "SportsCategory" } 
Run Code Online (Sandbox Code Playgroud)

和输入文本文件如下:

Soccer   -  Rooney  Gerrard   -  File .
Composite  file  picture  of  Liverpool 's  Steven  Gerrard   (left ,  dated  27  September  2006 )  and  Manchester  United 's  Wayne  Rooney   (dated  20  August  2006 ) .  On  the  occasion  of  his  21st  Birthday ,  Tuesday  24  October  2006 ,  Wayne  Rooney  has  hailed  England  team -mate  Steven  Gerrard  as  one  of  the  world 's  best  midfielders  and  wishes  the  Liverpool  star  could  play  at  Manchester  United .  
Run Code Online (Sandbox Code Playgroud)

任何人都可以告诉我,如果我错过任何其他步骤.我无法找到一步一步的说明:(我希望GATE的人会花一些时间写这样的教程.

Yas*_*sen 4

您的规则不会被解雇,因为带注释的文档中没有主要类型 Sports 的查找。

除非您在默认的 ANNIE 应用程序中添加了一些内容,否则我只是打开它,发现在默认的地名词典中只有一个主要类型为运动的文件,并且包含网球、游泳等内容,但没有足球。如果您使用基于规则的系统,您可能最终也会添加大量字典:)

一个好的做法是创建一个简单的测试文档,并按照 jape 规则运行管道(停止或排除此后的所有 PR),然后检查文档是否满足 LHS 先决条件。在你的情况下,应该有一个带有 MajorType sports 的查找。

我认为最好的 jape 分步教程可以在本培训材料中找到。但你已经明白了。