虽然regexp不是完全解析HTML文档的正确工具,但我发现很多人盲目地忽略了有关regexp的任何问题,如果他们在提议的文本中看到单个HTML标记那么多.
由于我们看到很多regexp的例子不是正确的工具,我对此提出了自己的看法:简单模式匹配比使用完整解析引擎更好的解决方案是什么?
html regex parsing
html ×1
parsing ×1
regex ×1