如何从tree-sitter中的节点获取值?

Rip*_*Rip 2 c rust treesitter

如果我在树保姆中有一个简单的语法:

rules: {
    expr: $ => choice(
        /[0-9]+/,
        prec.right(seq($.expr, /[+-]/, $.expr)),
    )
}
Run Code Online (Sandbox Code Playgroud)

和一个输入:

3+4
Run Code Online (Sandbox Code Playgroud)

我得到以下 CST:

(start [0, 0] - [0, 3]
  (expr [0, 0] - [0, 3]
    (expr [0, 0] - [0, 1])
    (expr [0, 2] - [0, 3])))
Run Code Online (Sandbox Code Playgroud)

所以我的问题是,如何从这些节点/叶子中获取值,即解析的内容。我必须以某种方式评估这棵树。我当然确信有办法,因为我还可以使用树保姆进行语法突出显示,以满足我需要的值(我猜)。但我阅读了文档并找不到任何注释,如何操作。

小智 5

Tree-sitter 的语法树不存储输入文本的副本。因此,要获取特定标记的文本,您必须使用 Tree-sitter 为您提供的范围来计算原始源代码的切片。

python 绑定中,这看起来像这样:

source_code_bytes = b'3 + 4'
tree = parser.parse(source_code_bytes)
node1 = tree.root_node.children[0].children[0]

node1_text = source_code_bytes[node1.start_byte:node1.end_byte].decode('utf8')
assert node1_text == '3'
Run Code Online (Sandbox Code Playgroud)

在某些语言绑定中,例如wasm 绑定,有一个.text帮助器可以使这变得更容易。

将这种辅助函数添加到 python 绑定中存在一个悬而未决的问题。