在PHP中解析无效HTML的最佳方法

dan*_*car 14 html php parsing

有没有更好的方法来解析无效的HTML然后应用Tidy?

旁注:有些情况下你不能提供Tidy.我还不建议使用Regexp来解析html.

Rob*_*Rob 6

我会尝试这样的事情:http://php.net/manual/en/domdocument.loadhtml.php

从该页面:

该函数解析字符串源中包含的HTML.与加载XML不同,HTML不必加载良好.也可以静态调用此函数来加载和创建DOMDocument对象.