滚动自己的XML解析器/ XML解析算法？

Question

所以,作为一个有趣的项目,我决定编写自己的XML解析器.不,不解析特定文档,不,不使用XML解析器库.我的意思是编写代码以将任何XML文档解析为可用的数据结构.只是因为我喜欢挑战.:-)

据说,到目前为止它被证明是有趣的.它最初看起来并不容易解析(特别是当你开始考虑特殊字符,CDATA,空标签,评论等)时.

在任何人都知道的地方是否有任何记录良好的XML解析算法或解释？看起来有各种各样的Queue和Stack以及BTree等等实现,但我不确定我是否曾经见过一个简单,记录良好的XML解析器算法......

我再说一遍:我不是在寻找一个预先构建的解析器库!我正在寻找有关如何创建自己的预构建解析器库的信息!不要告诉我"使用expat"或"使用SAX"或其他什么.那不是我要求的.

Answer 1

Antlr提供了解析XML 的教程.它将过程分解为阶段:lexing,解析,树解析等.看起来非常有趣.