如何使用c ++从HTML中提取文本?

0 html c++

如何使用c ++解析HTML标签?

例如:

<html><body>examlpe text </body></html>
Run Code Online (Sandbox Code Playgroud)

eas*_*sel 6

最简单的选择是使用HTML解析库.libxml2是一个可靠的开源软件,虽然它在技术上是一个C库.你需要加载你的html然后遍历DOM拉出所有的text()节点.我不知道我推荐这是你的第一个C++任务.