15 html c regex parsing
我需要从HTML(XHTML有效)页面中获取一些内容.我使用curl抓取页面并将其存储在内存中.
我玩过使用正则表达式和PCRE库的想法,但我只是找不到任何使用它的例子.然后我继续看看HTML解析器,再次没有一个好的选择.我所能找到的只是一个名为HTMLparser的libxml文档模块.
还有其他选择吗?如果没有,那么我已经找到的例子呢?
Byr*_*ock 12
您想使用HTML整理来执行此操作.Lib curl页面有一些源代码可以帮助你.穿过dom树的文件.您不需要xml解析器.在格式错误的HTML上不会失败.
http://curl.haxx.se/libcurl/c/htmltidy.html
Mic*_*ker 7
我会使用libhtmltidy +任何xml解析器,如expat或libxml.取决于你在寻找什么.
归档时间:
16 年,4 月 前
查看次数:
27512 次
最近记录:
9 年,5 月 前