Marpa解析器似乎无法应对可选的第一个符号?

Adr*_*onk 5 perl marpa

我一直在掌握Marpa解析器,当第一个符号是可选的时遇到了问题.这是一个例子:

use strict;
use warnings;
use 5.10.0;

use Marpa::R2;
use Data::Dump;

my $grammar = Marpa::R2::Scanless::G->new({source  => \<<'END_OF_GRAMMAR'});
:start ::= Rule
Rule ::= <optional a> 'X'
<optional a> ~ a *
a ~ 'a'
END_OF_GRAMMAR

my $recce = Marpa::R2::Scanless::R->new({grammar => $grammar});
dd $recce->read(\"X");
Run Code Online (Sandbox Code Playgroud)

当我运行它时,我收到以下错误:

Error in SLIF parse: No lexemes accepted at line 1, column 1
* String before error:
* The error was at line 1, column 1, and at character 0x0058 'X', ...
* here: X
Marpa::R2 exception at small.pl line 20
 at /usr/local/lib/perl/5.14.2/Marpa/R2.pm line 126
        Marpa::R2::exception('Error in SLIF parse: No lexemes accepted at line 1, column 1\x{a}...') called at /usr/local/lib/perl/5.14.2/Marpa/R2/Scanless.pm line 1545
        Marpa::R2::Scanless::R::read_problem('Marpa::R2::Scanless::R=ARRAY(0x95cbfd0)', 'no lexemes accepted') called at /usr/local/lib/perl/5.14.2/Marpa/R2/Scanless.pm line 1345
        Marpa::R2::Scanless::R::resume('Marpa::R2::Scanless::R=ARRAY(0x95cbfd0)', 0, -1) called at /usr/local/lib/perl/5.14.2/Marpa/R2/Scanless.pm line 926
        Marpa::R2::Scanless::R::read('Marpa::R2::Scanless::R=ARRAY(0x95cbfd0)', 'SCALAR(0x95aeb1c)') called at small.pl line 20
Run Code Online (Sandbox Code Playgroud)

Perl版本5.14.2(debian wheezy)
Marpa版本2.068000

(我看到有一个全新的Marpa 2.069我尚未尝试过)

这是我在语法上做错了吗?

amo*_*mon 6

在Marpa Scanless中,你的语法有两个层次:主要的高级语法,你可以归因于动作等等,以及低级别的lexing语法.它们是独立执行的(如果你使用传统的解析器/词法分析器,这是预期的,但是当你从正则表达式转到Marpa时会非常混乱).

现在在低级语法上,Marpa将您的输入识别为单个X,而不是"零as然后是X".然而,高级别语法要求optional a符号存在.

最好的方法是a在高级语法中使用可选项:

<optional a> ::= <many a>
<optional a> ::=  # empty

<many a> ~ a*  # would work the same here with "a+"
a ~ 'a'
Run Code Online (Sandbox Code Playgroud)

  • @Adrian:不,我不指望它.这是一个错误.我可以复制它,现在正在处理它. (3认同)
  • 阿隆说得对.lexeme永远不会是零长度,所以即使你使用*,它也会产生+的效果.我考虑过禁止在零长度上匹配的词法,但是用这种方式编写词汇通常非常方便. (2认同)
  • @Adrian:在Marpa-R2 2.069_002中修复了错误,现在在CPAN上修复.问题在于,带有非生产性符号的量化规则(一个从未消失或生成终端的符号)导致SEGV而不是错误消息.Marpa :: R2现在会生成相应的错误消息.谢谢! (2认同)