在普通的PEG(解析表达式语法)中,这是一个有效的语法:
values <- number (comma values)*
number <- [0-9]+
comma <- ','
Run Code Online (Sandbox Code Playgroud)
但是,如果我尝试使用LPeg编写此规则,则该规则的递归性质将失败:
local lpeg = require'lpeg'
local comma = lpeg.P(',')
local number = lpeg.R('09')^1
local values = number * (comma * values)^-1
--> bad argument #2 to '?' (lpeg-pattern expected, got nil)
Run Code Online (Sandbox Code Playgroud)
虽然在这个简单的例子中我可以重写规则以不使用递归,但我有一些我不想重写的现有语法.
如何在LPeg中编写自引用规则?
使用语法.
通过使用Lua变量,可以逐步定义模式,每个新模式使用先前定义的模式.但是,该技术不允许定义递归模式.对于递归模式,我们需要真正的语法.
LPeg表示带有表的语法,其中每个条目都是规则.
调用lpeg.V(v)创建一个模式,该模式表示语法中具有索引v的非终结符(或变量).因为在评估此函数时语法仍然不存在,结果是对相应规则的开放引用.
当表转换为模式时(通过调用lpeg.P或使用其中需要模式的表),表是固定的.然后更正由lpeg.V(v)创建的每个打开引用以引用表中由v索引的规则.
修复表时,结果是与其初始规则匹配的模式.表中索引为1的条目定义了其初始规则.如果该条目是字符串,则假定它是初始规则的名称.否则,LPeg假定条目1本身是初始规则.
例如,以下语法匹配a和b的字符串,它们具有相同数量的a和b:
Run Code Online (Sandbox Code Playgroud)equalcount = lpeg.P{ "S"; -- initial rule name S = "a" * lpeg.V"B" + "b" * lpeg.V"A" + "", A = "a" * lpeg.V"S" + "b" * lpeg.V"A" * lpeg.V"A", B = "b" * lpeg.V"S" + "a" * lpeg.V"B" * lpeg.V"B", } * -1它相当于标准PEG表示法中的以下语法:
Run Code Online (Sandbox Code Playgroud)S <- 'a' B / 'b' A / '' A <- 'a' S / 'b' A A B <- 'b' S / 'a' B B