使用wget从网站下载特定类型的所有文件

Nei*_*eil 8 recursion screen-scraping wget

以下不起作用.我不知道为什么它只在起始网址中停止,不要进入其中的链接来搜索给定的文件类型.

wget -r -A .pdf home_page_url

以任何其他方式递归下载网站中的所有pdf文件.?

rim*_*rul 1

它可能基于 robots.txt。尝试添加-e robots=off.

其他可能的问题是基于 cookie 的身份验证或 wget 的代理拒绝。 请参阅这些示例。

编辑:根据sunsite.univie.ac.at ,“.pdf”中的点是错误的