我有一个网站(http://a-site.com),里面有很多这样的链接。如何使用 wget 抓取和 grep 此类文件链接?
<a href="/user/333333/follow_user" class="btn" rel="nofollow">Follow</a>
Run Code Online (Sandbox Code Playgroud)
我试过这个,但这个命令不会让我得到与 nofollow 的链接。
$ wget --no-verbose -r -l1 http://a-site.com 2>&1
Run Code Online (Sandbox Code Playgroud)
来自这里的信息:
http://skeena.net/kb/wget%20ignore%20robots.txt
尝试:
wget -erobots=off http://your.site.here
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2570 次 |
| 最近记录: |