我正在使用以下命令从网页下载所有文件:
wget --recursive "http://example.com"
Run Code Online (Sandbox Code Playgroud)
这有时会给我以下错误:
no-follow attribute found in www.example.com. Will not follow any links on this page
Run Code Online (Sandbox Code Playgroud)
根据gnu.org,我必须添加-e robots=off --wait 0.25到我的命令中。
我的最终命令如下所示(我不想要span-hosts):
wget --recursive -e robots=off --wait 0.5 "http://example.com"
Run Code Online (Sandbox Code Playgroud)
但是我仍然收到上述错误。我该怎么做才能忽略这些属性?
小智 -2
就我而言,我在--follow-tags. 删除语法错误让 wget 继续,尽管有 no-follow 属性。
在此处查看更多信息:https ://unix.stackexchange.com/a/258850
| 归档时间: |
|
| 查看次数: |
1331 次 |
| 最近记录: |