Bur*_*rad 5 error-handling parsing antlr
我们有一个Antlr语法的以下子部分:
signed_int
: SIGN? INT
;
INT : '0'..'9'+
;
Run Code Online (Sandbox Code Playgroud)
当有人输入一个数值时,一切都很好,但如果他们错误地输入类似1O(一个和大写o)的东西,我们会得到一个神秘的错误信息:
error 1 : Missing token at offset 14
near [Index: 0 (Start: 0-Stop: 0) ='<missing COLON>' type<24> Line: 26 LinePos:14]
: syntax error...
Run Code Online (Sandbox Code Playgroud)
处理此类错误的好方法是什么?我想过定义catch-all SYMBOL令牌类型,但这会导致解析器构建错误太多.我将继续研究Antlr错误处理,但我想我会在这里发布以寻找一些见解.
您应该覆盖词法分析器和解析器中的 reportError 方法。您可以通过将此代码添加到您的词法分析器文件中来实现:
@Override
public void reportError(RecognitionException e) {
throw new RuntimeException(e);
}
Run Code Online (Sandbox Code Playgroud)
并在解析器中创建一个方法匹配,以检查输入字符串是否与指定的语法匹配:
public static boolean matches(String input) {
try {
regExLexer lexer = new regExLexer(new ANTLRStringStream(input));
regExParser parser = new regExParser(new CommonTokenStream(lexer));
parser.goal();
return true;
} catch (RuntimeException e) {
return false;
}
catch (Exception e) {
return false;
}
catch (OutOfMemoryError e) {
return false;
}
}
@Override
public void reportError(RecognitionException e) {
throw new RuntimeException(e);
}
Run Code Online (Sandbox Code Playgroud)
然后在你的文件中使用 Parser.matches(input); 检查给定的输入是否与语法匹配。如果匹配该方法返回 true,否则返回 false,因此当它返回 false 时,您可以向用户提供任何自定义的错误消息。