构建基于正则表达式的解析器

red*_*nzz 5 regex parsing

构建基于正则表达式的解析器是愚蠢的吗?

tch*_*ist 15

使用现代模式匹配嵌套的parens非常简单.不计算空格,这类事情:

\( (?: [^()] *+ | (?0) )* \)
Run Code Online (Sandbox Code Playgroud)

适用于主流语言,如Perl和PHP,以及任何使用PCRE的东西.

但是,你真的需要完整解析的语法正则表达式,否则你会疯了.不要使用其正则表达式不支持将正则表达式分解为较小单元的语言,或者不支持正确调试其编译和执行的语言.生活对于低级别的hackery来说太短暂了.如果你打算这样做,也可以回到汇编语言.

我已经写了很多关于递归模式,语法模式和解析的内容:例如,请参阅此处的解析方法,这里是lexer方法 ; 还有,这里最终解决方案.

此外,Perl的Regexp::Grammars模块在将语法正则表达式转换为解析结构时特别有用.

所以,无论如何,去吧.你会从中学到很多东西.


Mat*_*att 8

工作?是.为了学习?没有.