如何在 Raku 语法中使用 :global 进行匹配？

Question

如何在 Raku 语法中使用 :global 进行匹配？

Jos*_*osh 8 raku

我正在尝试编写一个 Raku 语法，它可以解析要求编程难题的命令。

这是仅针对我的问题的简化版本，但这些命令将难度级别与可选的语言列表结合在一起。

示例有效输入：

无语言： easy
一种语言： hard javascript
多种语言： medium javascript python raku

我可以让它匹配一种语言，但不能匹配多种语言。我不确定在哪里添加:g.

这是我到目前为止所拥有的一个例子：

grammar Command {
    rule TOP { <difficulty> <languages>? }

    token difficulty { 'easy' | 'medium' | 'hard' }

    rule languages { <language>+ }
    token language { \w+ }
}

multi sub MAIN(Bool :$test) {
    use Test;
    plan 5;

    # These first 3 pass.
    ok Command.parse('hard', :token<difficulty>), '<difficulty> can parse a difficulty';

    nok Command.parse('no', :token<difficulty>), '<difficulty> should not parse random words';

    # Why does this parse <languages>, but <language> fails below?
    ok Command.parse('js', :rule<languages>), '<languages> can parse a language';

    # These last 2 fail.
    ok Command.parse('js', :token<language>), '<language> can parse a language';

    # Why does this not match both words? Can I use :g somewhere?
    ok Command.parse('js python', :rule<languages>), '<languages> can parse multiple languages';
}

Run Code Online (Sandbox Code Playgroud)

这有效，即使我的测试 #4 失败了：

my token wrd { \w+ }
'js' ~~ &wrd;  #=> ?js?

Run Code Online (Sandbox Code Playgroud)

使用此语法提取多种语言可以使用正则表达式，但我不确定如何在语法中使用它：

'js python' ~~ m:g/ \w+ /;  #=> (?js? ?python?)

Run Code Online (Sandbox Code Playgroud)

另外，是否有一种理想的方法可以使顺序变得不重要，以便它difficulty可以出现在字符串中的任何位置？例子：

rule TOP { <languages>* <difficulty> <languages>? }

Run Code Online (Sandbox Code Playgroud)

理想情况下，我希望将不是 a 的任何内容difficulty读作language. 示例：raku python medium js应读medium作 a difficulty，其余读作languages。

Answer 1

use*_*601 7

这里有两个问题。

要指定一个语法解析子规则，指定的参数是永远 :rule，无论在文法这是一个rule，token，method，或regex。您的前两个测试通过了，因为它们代表有效的完整语法解析（即TOP），因为:token命名参数被忽略，因为它是未知的。

这让我们：

ok  Command.parse('hard',      :rule<difficulty>), '<difficulty> can parse a difficulty';
nok Command.parse('no',        :rule<difficulty>), '<difficulty> should not parse random words';
ok  Command.parse('js',        :rule<languages> ), '<languages> can parse a language';
ok  Command.parse('js',        :rule<language>  ), '<language> can parse a language';
ok  Command.parse('js python', :rule<languages> ), '<languages> can parse multiple languages';

# Output
ok 1 - <difficulty> can parse a difficulty
ok 2 - <difficulty> should not parse random words
ok 3 - <languages> can parse a language
ok 4 - <language> can parse a language
not ok 5 - <languages> can parse multiple languages

Run Code Online (Sandbox Code Playgroud)

第二个问题是如何在rule. 在 a 中token，以下内容是等效的：

token foo { <alpha>+  }
token bar { <alpha> + }

Run Code Online (Sandbox Code Playgroud)

但是在 a 中rule，它们会有所不同。比较以下规则的令牌等效项：

rule  foo { <alpha>+       } 
token foo { <alpha>+ <.ws> }

rule  bar { <alpha> +         }
token bar { [<alpha> <.ws>] + }

Run Code Online (Sandbox Code Playgroud)

在您的情况下，您有<language>+，并且由于language是\w+，因此不可能匹配两个（因为第一个将消耗所有\w）。简单的解决方案，只需更改<language>+为<language> +.

为了让<difficulty>令牌浮动，我想到的第一个解决方案是匹配它并在<language>令牌中保释：

token language { <!difficulty> \w+ }

Run Code Online (Sandbox Code Playgroud)

<!foo>如果在那个位置，它可以匹配，就会失败<foo>。这将几乎完美地工作，直到您获得像“easyFoo”这样的语言。简单的解决方法是确保难度标记始终出现在单词边界处：

token difficulty {
   [
   | easy
   | medium
   | hard
   ]
   >> 
}

Run Code Online (Sandbox Code Playgroud)

其中>>断言右侧的单词边界。

请参阅 [何时空格在 Raku 语法中真正重要？](/sf/ask/3422461451/) 进行详细说明的讨论@user0721090601 解释的问题是您遇到的所有失败的根源。事实上，未处理的命名参数会被忽略，这具有实际和战略上的进化好处，但缺点是目前它是在没有警告的情况下完成的。目前，您需要意识到这一缺点。Aiui、Raku、Rakudo 和/或 CommaIDE 可能会在未来几年提供缓解。 (2认同)

归档时间：	5 年，1 月前
查看次数：	57 次
最近记录：	5 年，1 月前