是否可以将Perl的Marpa解析器用于公共网络服务器?

cev*_*ing 8 perl parsing taint marpa

Perl的Marpa解析器的文档包含以下关于污染数据的部分:

Marpa :: R2的存在允许其输入以灵活和强大的方式改变执行.Marpa不应该与不受信任的输入一起使用.在Perl的污点模式中,使用Marpa的SLIF接口时会出现致命错误,该接口具有受污染的语法,受污染的输入字符串或受污染的令牌值.

如果我理解这种限制的后果,我不确定.我明白,语法一定不会被污染.但我不明白输入不应该被污染.对我来说,解析器的任务是验证输入.解析器必须信任其输入对我来说听起来不合理.

真的那样吗?用Marpa实现任何类型的公共网络服务是不可能的吗?

我之所以这样问是因为其中一个参考用例是Marpa HTML解析器,而且使用HTML解析器似乎是矛盾的,虽然大约99,99%的HTML可能被污染,但它不能与受污染的数据一起使用.

任何人都可以解释这个矛盾吗?

Jef*_*ler 6

Marpa实际上比其他解析器更安全,因为它解析的语言正是BNF指定的语言.使用正则表达式,PEG等,很难确定实际解析的语言.在实践中,程序员倾向于让一些测试用例工作然后放弃.

特别是,解析不需要的输入可能是一个主要的安全问题 - 对于传统的解析器,您通常不会知道您要通过的所有内容.测试套件很少检查是否确实接受了应该是错误的输入.Marpa 完全解析了其规范中的语言 - 没有更多,仅此而已.

为什么关于污点模式的恐慌语言呢?在最常见的情况下,Marpa可以被视为一种编程语言,并且具有完全相同的安全性问题.根据定义,允许用户执行任意代码是不安全的,这正是C,Perl,Marpa等通过设计所做的事情.您不能为不受信任的用户提供通用语言界面.这对C,Python等来说很明显,但我认为有人可能会在Marpa的情况下忽略它.因此恐吓语言.

Marpa比竞争技术更安全.但是,在最一般的情况下,这不够安全.