标签: antlr

哪个面向Java的lexer解析器用于简单项目(ANTLR,DIY等)

我正在研究一个小型文本编辑器项目,并希望为几种语言添加基本的语法高亮(Java,XML ......仅举几例).作为一种学习经历,我想添加一个流行或非流行的Java词法分析器.

你推荐什么项目.Antlr可能是最知名的,但它似乎相当复杂和沉重.

这是我所知道的选项.

ANTLR
Ragel(是的,它可以生成用于处理输入的Java源代码)
自己动手(我想我可以编写一个简单的令牌解析器并突出显示源代码).

java dsl parsing antlr ragel

Ber*_*own

2009 03-05

7
推荐指数

1
解决办法

6483
查看次数

ANTLR Regex中的范围量化语法

这应该很简单.我正在使用ANTLR编写词法分析器语法,并希望将变量标识符的最大长度限制为30个字符.我试图用这一行完成这个(遵循正常的正则表达式 - 除了''thing - 语法):

ID  :   ('a'..'z'|'A'..'Z') ('a'..'z'|'A'..'Z'|'0'..'9'|'_'){0,29}  {System.out.println("IDENTIFIER FOUND.");}
    ;

Run Code Online (Sandbox Code Playgroud)

代码生成没有错误,但由于生成的代码中的一行简单而导致编译失败:

0,29

显然,antlr将括号内的文本部分与打印线一起放在接受状态区域.我搜索了ANTLR网站,但没有找到相应表达式的示例或引用.这个表达式的语法应该是什么？

java regex antlr

use*_*761

2012 08-30

7
推荐指数

1
解决办法

3067
查看次数

如何在Java方法/函数中列出所有局部变量？

我的主要问题:我知道你可以通过反射来输出类字段,即使你不知道变量名,类型,甚至有多少.但是,有没有办法列出当前函数或当前范围内的所有变量,假设我不知道变量名是什么？

换一种说法:

int x = 5;
int y = 42;
// some more code
//Now I want to println x and y, but assuming I cannot use "x" or "y".

Run Code Online (Sandbox Code Playgroud)

我也很高兴回答这个问题:假设我允许存储所有变量的名称,这有帮助吗？例如:

Set<String> varNames = new HashSet<String>();
int x = 5;
varNames.add("x");
int y = 42;
varNames.add("y");
// some more code
//Now with varNames, can I output x and y without using "x" or "y"?

Run Code Online (Sandbox Code Playgroud)

我为什么这么问？我正在使用ANTLR将XYZ语言翻译成java,我想提供一种简单的方法来在任何时间点输出程序的整个状态.

第三种可能的解决方案我很满意:如果在Java中这是不可能的,有什么方法可以为访问调用函数并检查堆栈的函数编写字节码？这也可以解决问题.

令人惊奇的是,如果Java具有相当于Python eval()或php的功能get_defined_vars().

如果它有所作为,我使用Java 6,但Java 5,6或7的任何东西都应该是好的.

谢谢!

java compiler-construction reflection profiling antlr

Arc*_*mag

2012 09-30

7
推荐指数

1
解决办法

3083
查看次数

Antlr处理异常

我使用AST树使用Antlr 3开发了一个复杂的语法.ANTLR生成Lexer和Parser.问题是当用户输入例如无效的语法时,语法期望';'.用户不输入,然后在我的Eclipse IDE中我得到以下异常:

 line 1:24 mismatched input '<EOF>' expecting ';'

Run Code Online (Sandbox Code Playgroud)

如何处理此异常,因为我试图捕获此异常,但是没有捕获异常.这是一个例外吗？我似乎不明白为什么没有捕获此异常.我试图找出答案,但Antlr网站似乎已经停止了一段时间了.

我查看了以下内容:使用"$"和Java进行ANTLR异常处理并遵循该示例,但是当Lexer通过添加RuntimeException()生成代码时,我得到了无法访问的代码.

我不知道该怎么做.

当我尝试从解析器获取语法错误的数量时,它显示0.

编辑:

我找到了一个解决方案,通过查看:ANTLR不会在无效输入上抛出错误

但是,当我尝试获取Exception消息时,它为null.我是否正确设置了一切？请参阅示例语法:

grammar i;

options {
output=AST;
}

@header {
package com.data;
}

@rulecatch {
    catch(RecognitionException e) {
        throw e;
   }
}

// by having these below it makes no difference
/**@parser::members {
    @Override
    public void reportError(RecognitionException e) {
        throw new RuntimeException("Exception : " + " " + e.getMessage());
    }
}

@lexer::members {
    @Override
    public void reportError(RecognitionException e) {
       throw new RuntimeException("Exception …

Run Code Online (Sandbox Code Playgroud)

java error-handling antlr

use*_*481

2017 05-23

7
推荐指数

1
解决办法

7890
查看次数

在使用Maven构建时如何在Antlr4中导入语法？

我正在尝试用Maven构建一个ANTLR项目,项目结构就像

src/main +
      |-antlr4
             |-fo/bar
                   |-G1.g4
                   |-G2.g4
             |-imports

Run Code Online (Sandbox Code Playgroud)

其中G1进口G2如:

grammar G1;
import G2;

Run Code Online (Sandbox Code Playgroud)

但是,当我使用Maven构建时,我收到以下错误:

[ERROR] Message{errorType=CANNOT_FIND_IMPORTED_GRAMMAR, args=[G2, fo\bar\G1.g4], e=null, fileName='null', line=-1, charPosition=-1}

Run Code Online (Sandbox Code Playgroud)

它的工作原理没有问题,如果我把G1.g4和G2.g4直属antlr4目录.在我看来,当将Grammar文件放在一个包中时,它需要在import语句中使用特殊语法.

我注意到Antlr4 maven插件无法在不同目录中找到语法文件的问题,但在这里,语法在一个目录中.

antlr maven

Wud*_*ong

2018 04-10

7
推荐指数

1
解决办法

1867
查看次数

ParseTreeVisitor或ParseTreeListener

我正在尝试编写AST解释器/ REPL.ANTLRv4提供两个非常相似的接口(ParseTreeVisitor和ParseTreeListener)来遍历解析树.我似乎无法找到它们之间的任何重大差异,并且文档相当稀疏.一个界面比另一个更好吗？

java antlr

Jos*_*hua

lucky-day

7
推荐指数

1
解决办法

951
查看次数

返回不同类型的对象时，将 Visitor 或 Listener 与 ANTLR4 结合使用

我使用 ANTLR4 将一种语言翻译成另一种语言。例如，当我读取数字文字时，我可以返回Integeror Double。

@Override
public Integer visitIntegerValue(Parser.IntegerValueContext ctx) {
    return Integer.valueOf(ctx.getText());
}

@Override
public Double visitDoubleValue(Parser.DoubleValueContext ctx) {
    return Double.valueOf(ctx.getText());
}

Run Code Online (Sandbox Code Playgroud)

最终，如果您进一步扩展此方法并引入其他构造（例如字符串和条件），则对于访问者来说唯一合理的类型是class Visitor extends BaseVisitor<Object>，但它会导致代码大量添加instanceof. 例如

@Override
public CollectionQuery visitCondition(Parser.ConditionContext ctx) {
    Property property = (Property) visit(ctx.property());
    String operator = (String) visit(ctx.operator());
    Object value = visit(ctx.amount());
    Object condition;
    if (value instanceof String && operator.equals("$regex")) {
        condition = Pattern.compile((String) value, Pattern.CASE_INSENSITIVE);
    }
    ...
}

Run Code Online (Sandbox Code Playgroud)

虽然我不介意这种“动态性”，但我想知道这是否是一种可维护的继续方式，或者是否应该使用其他技术，例如创建目标语言结构的适当层次结构。

java antlr antlr4

vas*_*ily

2015 04-14

7
推荐指数

1
解决办法

4366
查看次数

Antlr 箭头语法

我在bash 的 Antlr 解析器中找到了这个语法：

file_descriptor
    :   DIGIT -> ^(FILE_DESCRIPTOR DIGIT)
    |   DIGIT MINUS -> ^(FILE_DESCRIPTOR_MOVE DIGIT);

Run Code Online (Sandbox Code Playgroud)

语法有什么->作用？

它叫什么名字，我可以通过谷歌搜索来阅读它？

《Antlr4 权威指南》只有一页内容。它指的是“词法分析器命令”，但它从未命名运算符。书中的用法与 bash 解析器中的用法不同。

antlr

Mic*_*ter

lucky-day

7
推荐指数

1
解决办法

1705
查看次数

ANTLR词法分析器如何消除其规则的歧义(或者为什么我的解析器会产生"不匹配的输入"错误)？

注意:这是一个自我回答的问题,旨在提供有关ANTLR用户最常犯错误之一的参考.

当我测试这个非常简单的语法时:

grammar KeyValues;

keyValueList: keyValue*;
keyValue: key=IDENTIFIER '=' value=INTEGER ';';

IDENTIFIER: [A-Za-z0-9]+;
INTEGER: [0-9]+;

WS: [ \t\r\n]+ -> skip;

Run Code Online (Sandbox Code Playgroud)

通过以下输入: