如果 LR(1) 解析器无法解析 c++，gcc/clang 如何解析它？

Question

如果 LR(1) 解析器无法解析 c++，gcc/clang 如何解析它？

xil*_*pex 0 c++ grammar parsing recursive-descent lr-grammar

GCC/Clang 是手写解析器。我读到一篇文章说 C++ 不能被 LR(1) 解析器解析（Why can't C++ be parsed with a LR(1) parser?）。如果是这样，当 LR(1) 比递归下降更强大时，为什么 GCC/Clang 是手写的递归下降解析器？

Answer 1

ric*_*ici 5

GCC/Clang 不是严格的递归下降解析器；它们允许回溯（重新解析任意长的文本），以及其他与理论纯粹性的偏差。回溯解析器严格来说比非回溯解析器更强大（但代价是不再是线性时间）。

当问题以这种方式表达时，解析 C++ 的真正复杂性就消失了。如果将 C++ 剥离为附录 A 中 BNF 描述的超集，那么您基本上只需要准备好考虑几种替代解析。您可以通过回溯来做到这一点——尝试一种可能性，如果失败，则尝试其他一些可能性——或者通过并行探索，使用 GLR/GLL 或其他一些变体；没什么太痛苦的。但真正的工作还需要面对：

预处理器，不是特别复杂，但无法用任何类似于正式解析框架的东西来描述；
模板实例化，将语义分析混合到解析过程中（并且需要这样做才能发现正确的解析）；
名称解析，有些人可能不认为这是解析的一部分，但在您知道特定标识符引用哪个语法对象之前，您不会继续下一步。（如果您认为名称解析很简单，请重读第 6.5 节（名称查找）中 C++ 标准的 13 页密集页，然后继续阅读第 12 节中关于解析重载名称的 35 页。）

归档时间：	5 年，8 月前
查看次数：	685 次
最近记录：	5 年，8 月前