我正在尝试用C++做一个非常简单的网络爬虫/蜘蛛应用程序.我一直在谷歌搜索一个简单的理解这个概念.我发现了这个:
http://www.example-code.com/vcpp/spider.asp
但是,它有点复杂/难以消化.
我想做的只是,例如:
输入网址:www.example.com(我将使用bash-> wget,获取内容/源代码)
然后,将寻找,也许"一个href"链接,然后存储在一些数据文件中.
对我来说,任何简单的教程或指南?
我刚开始学习C++(1个月)
c++ web-crawler
c++ ×1
web-crawler ×1