Mar*_*boe 4 parsing antlr context-free-grammar
我对 ANTLR 很陌生,所以这可能是一个简单的问题。
我定义了一种简单的语法,它应该包含带有数字和标识符的算术表达式(以字母开头并以一个或多个字母或数字继续的字符串。)
语法如下:
grammar while;
@lexer::header {
package ConFreeG;
}
@header {
package ConFreeG;
import ConFreeG.IR.*;
}
@parser::members {
}
arith:
term
| '(' arith ( '-' | '+' | '*' ) arith ')'
;
term returns [AExpr a]:
NUM
{
int n = Integer.parseInt($NUM.text);
a = new Num(n);
}
| IDENT
{
a = new Var($IDENT.text);
}
;
fragment LOWER : ('a'..'z');
fragment UPPER : ('A'..'Z');
fragment NONNULL : ('1'..'9');
fragment NUMBER : ('0' | NONNULL);
IDENT : ( LOWER | UPPER ) ( LOWER | UPPER | NUMBER )*;
NUM : '0' | NONNULL NUMBER*;
fragment NEWLINE:'\r'? '\n';
WHITESPACE : ( ' ' | '\t' | NEWLINE )+ { $channel=HIDDEN; };
Run Code Online (Sandbox Code Playgroud)
我将 ANTLR v3 与 ANTLR IDE Eclipse 插件一起使用。当我使用解释器解析表达式时(8 + a45),仅生成解析树的一部分:
为什么第二项 (a45) 没有被解析?如果两项都是数字,也会发生同样的情况。
您需要创建一个包含EOF(文件结尾)标记的解析器规则,以便解析器将被迫遍历整个标记流。
将此规则添加到您的语法中:
parse
: arith EOF
;
Run Code Online (Sandbox Code Playgroud)
并让解释器从该规则而不是arith规则开始: