Wai*_* II 5 java web-crawler crawler4j
我想设置抓取工具抓取一个网站,比如说博客,然后只获取网站中的链接并将链接粘贴到文本文件中.你可以一步一步地指导我设置爬虫吗?我正在使用Eclipse.
Aha*_*med 0
Jsoup会做你需要的 html 解析的一切。Jsoup是一个用于处理html源代码的java api。你可以得到
和更多。
为了您的目的,这里是示例代码。
希望对你有帮助。
归档时间:
14 年,11 月 前
查看次数:
2548 次
最近记录:
8 年,4 月 前