从网页中过滤超链接并下载所有匹配特定模式的链接

Mar*_*wan 4 grep download wget filter curl

我想从我们组织的图形存储库网页下载所有图形文件。它们是 Illustrator ( .ai) 格式和 Corel Draw ( .cdr) 格式。

它们是直接超链接的(即<a href="http://server/path-to-file.ai">...</a>.

Ste*_*itt 8

wget 包括直接支持此功能的功能:

wget -r -A "*.ai,*.cdr" 'address-of-page-with-hyperlinks'
Run Code Online (Sandbox Code Playgroud)

-r启用递归模式,因此它将下载超过给定 URL-A的文件,并限制它将下载并最终保留的文件。