wget 不会忽略 no-follow 属性

con*_*tti 6 linux wget

我正在使用以下命令从网页下载所有文件:

wget --recursive "http://example.com"
Run Code Online (Sandbox Code Playgroud)

这有时会给我以下错误:

no-follow attribute found in www.example.com. Will not follow any links on this page
Run Code Online (Sandbox Code Playgroud)

根据gnu.org,我必须添加-e robots=off --wait 0.25到我的命令中。

我的最终命令如下所示(我不想要span-hosts):

wget --recursive -e robots=off --wait 0.5 "http://example.com"
Run Code Online (Sandbox Code Playgroud)

但是我仍然收到上述错误。我该怎么做才能忽略这些属性?

小智 -2

就我而言,我在--follow-tags. 删除语法错误让 wget 继续,尽管有 no-follow 属性。

在此处查看更多信息:https ://unix.stackexchange.com/a/258850