如何使用终端从网站(而非网页)下载所有图像?

Zig*_*gnd 5 linux terminal download images

我想要一个命令,我输入一个 URL,例如 photos.tumblr.com,它会在一个文件夹中下载此站点上的所有照片,但不仅仅是站点主页的图像。该命令需要从站点的各个部分下载图片,例如photos.tumblr.com/ph1/1.png/photos.tumblr.com/ph3/4.jpg。

请给我看一个使用这个 url 的例子:http : //neverending-fairytale.tumblr.com/并在回答问题之前测试它

小智 6

您可以使用:

wget -r -A=.jpg,.png http://website.com
Run Code Online (Sandbox Code Playgroud)

使用此命令,您将获得所有 JPG 和 PNG 文件,但您可能会被禁止访问该站点。

所以,如果你使用:

wget --random-wait --limit-rate=100k -r -A=.jpg,.png http://website.com
Run Code Online (Sandbox Code Playgroud)

您将让您的图片在下载和设置速度限制之间等待一段随机时间。


小智 1

您可以下载整个网站(我会使用wget -r -p -l inf -np),然后(或同时)运行 shell 脚本来删除所有非图像文件(该file命令可用于检查文件是否是图像)。

-A/-Rwget 的选项并不可靠;它们只检查 URL 的扩展名(因此您可以按 .jpg、.jpeg、.png 等进行过滤),但不要求这些必须存在。)