wget如何只保存链接到目标页面链接的页面的某些文件类型,而不管某些文件所在的域?
试图加快我必须经常完成的任务.
我一直在浏览wget文档和谷歌搜索,但似乎没有任何工作.我继续只获取目标页面或没有文件的子页面(甚至使用-H),所以我显然在这方面做得很糟糕.
因此,实际上,example.com/index1/包含指向example.com/subpage1/和example.com/subpage2/的链接,而子页面包含指向example2.com/file.ext和example2.com/file2.ext等的链接但是,example.com/index1.html可能链接到example.com/index2/,它链接到我不想要的更多子页面.
甚至可以做到这一点,如果没有,那么你建议我使用什么?谢谢.
The*_*ect 15
以下命令对我有用.
wget -r --accept "*.ext" --level 2 "example.com/index1/"
Run Code Online (Sandbox Code Playgroud)
需要递归,所以-r
应该添加.
像这样的东西应该有效:
wget --accept "*.ext" --level 2 "example.com/index1/"
Run Code Online (Sandbox Code Playgroud)