忽略 Antlr4 中的空格（在某些部分）

Question

忽略 Antlr4 中的空格（在某些部分）

Geo*_*nis 4 parsing removing-whitespace antlr4

我对 antlr 不太熟悉。我正在使用第 4 版，并且我有一个语法，其中空格在某些部分并不重要（但在其他部分可能很重要，或者更确切地说是它的运气）。

所以说我们有以下语法

grammar Foo;
program : A* ;
A  : ID '@' ID '(' IDList ')' ';' ;
ID : [a-zA-Z]+ ;
IDList : ID (',' IDList)* ;
WS : [ \t\r\n]+ -> skip ;

Run Code Online (Sandbox Code Playgroud)

和一个测试输入

foo@bar(X,Y);
foo@baz  ( z,Z) ;

Run Code Online (Sandbox Code Playgroud)

第一行被正确解析而第二行没有。我不想用空格不相关的地方来玷污我的规则，因为我的实际语法比玩具示例更复杂。如果不清楚部分 ID'@'ID 不应有空格。任何其他位置的空白都无关紧要。

Answer 1

GRo*_*erg 5

即使您跳过 WS，词法分析器规则仍然对空格字符的存在敏感。跳过只是意味着不生成任何令牌供解析器使用。因此，词法分析器Addr规则明确不允许任何内部空白字符。

相反，a和idList解析器规则永远不会看到内部空白标记，因此这些规则对生成的标记之间出现的空白字符不敏感。

grammar Foo;

program : a* EOF ; // EOF will require parsing the entire input

a  : Addr LParen IDList RParen Semi ;
idList : ID (Comma ID)* ;  // simpler equivalent construct

Addr : ID '@' ID ;
ID : [a-zA-Z]+ ;
WS : [ \t\r\n]+ -> skip ;

Run Code Online (Sandbox Code Playgroud)

Answer 2

Cor*_*onA 1

定义ID '@' ID为词法分析器标记而不是解析器标记。

A  : AID '(' IDList ')' ';' ;

AID : [a-zA-Z]+ '@' [a-zA-Z]+;

Run Code Online (Sandbox Code Playgroud)

其他选项

启用/禁用令牌流中的空格，例如此处
使用词法分析器模式启用/禁用空格（可能是一个问题，因为词法分析器模式是在上下文中触发的，这在您的情况下不容易确定）

归档时间：	10 年，10 月前
查看次数：	5516 次
最近记录：	5 年，3 月前