从网站递归下载

Gir*_*h T 3 download wget web curl

我正在尝试从网站 url " www.example.com/products"获取图像,该产品文件夹中有很多子文件夹,我需要下载产品文件夹。

在 www.example.com/products、www.example.com/products/subfolders 中,图片是

  • www.example.com/products/subfolder1/image.jpg,
  • www.example.com/products/subfolder2/image.jpg,
  • www.example.com/products/subfolder3/image.jpg

如何下载包含数据的子文件夹的产品文件夹。

Rah*_*hul 5

wget -nd -r -l1 -P /save/location -A jpeg,jpg http://www.example.com/products
Run Code Online (Sandbox Code Playgroud)

解释 :

-nd防止创建目录层次结构(即没有目录)。

-r启用递归检索。有关详细信息,请参阅递归下载

-l1指定递归最大深度级别。1 在您的情况下仅用于此目录,它是products.

-P 设置保存所有文件和目录的目录前缀。

-A设置白名单以仅检索某些文件类型。接受字符串和模式,两者都可以用在逗号分隔的列表中(如上所示)。有关更多信息,请参阅文件类型