mik*_*e g 19
收到的智慧是使用解析器生成器+语法,这似乎是一个很好的建议,因为您使用的是一个严格的工具,并且可能会减少工作中的错误和潜在的错误.
要使用解析器生成器,语法必须是无上下文的.如果您正在设计要解析的语言,那么您可以控制它.如果您不确定,那么如果您开始语法路线,可能会花费很多精力.即使它在实践中没有上下文,除非语法是巨大的,否则手动编写递归的正确解析器可能更简单.
无上下文不仅可以使解析器生成器成为可能,而且还使手动编码解析器更加简单.你最终得到的是每个短语一个(或两个)函数.如果你干净地组织和命名代码并不是比语法更难看(如果你的IDE可以向你展示调用hierachies,那么你几乎可以看到语法是什么).
优点:-
我并不是说语法总是不合适,但通常效益很小,而且往往不会受到成本和风险的影响.
(我认为对他们的论点似是有吸引力的,并且他们普遍存在偏见,因为它是一种表明一个人更懂计算机科学知识的方式.)
Ano*_*ous 10
几条建议:
不要过度使用正则表达式 - 虽然它们有它们的位置,但它们根本没有能力处理任何类型的真正解析.你可以推动他们,但你最终会撞到一堵墙或最终导致无法维护的混乱.你最好找一个可以处理更大语言集的解析器生成器.如果你真的不想进入工具,你可以看一下递归下降解析器 - 这是一个非常简单的手工编写小解析器的模式.它们不像大解析器生成器那样灵活或功能强大,但它们的学习曲线要短得多.
除非你有非常严格的性能要求,试着让你的图层分开 - 词法分析器读取单个标记,解析器将它们排列到树中,然后语义分析检查所有内容并链接引用,然后是最后阶段输出任何内容正在制作中.保持逻辑的不同部分分开将使以后更容易维护.
是的.尝试生成它,而不是写.考虑使用yacc,ANTLR,Flex/Bison,Coco/R,GOLD Parser生成器等.只有当现有的解析器生成器都不符合您的需求时,才能手动编写解析器.