在C++中解析HTML解析?

pR0*_*0Ps 4 c++ html-parsing

我正在寻找一种解决方案来解析C++中可能格式错误的HTML,类似于Beautiful Soup在Python中所做的.

通常,只使用XML解析器就可以工作,但在这种情况下,特定的HTML不是有效的XML/XHTML,无法正确解析.

是否存在用于此的库/工具?

ima*_*huk 6

您可以使用HTMLTidy将HTML转换为有效的XML,然后使用任何可用的C++ XML解析器