有一个wget下载我正在尝试执行.
它下载了几千个文件,除非我开始限制文件类型(垃圾文件等).从理论上讲,限制文件类型是可以的.
但是,有很多文件可以在没有文件扩展名的情况下下载,例如,当用Adobe手动打开时,实际上是PDF文件.这些实际上是我想要的文件.
将wget限制为filetype PDF不会下载这些文件.
到目前为止,我的语法是wget -r --no-parent A.pdf www.websitehere.com
使用wget -r --no-parent www.websitehere.com为我带来了每种文件类型,所以理论上我拥有一切.但这意味着我要删除1000个垃圾文件,然后重命名几百个未知文件类型的有用文件.
有关如何使用适当的文件扩展名来保存和保存文件的任何想法?
或者,一种方法将wget限制为只有没有文件扩展名的文件,然后是一个单独的批处理方法来确定文件类型并适当地重命名?
手动测试每个文件以确定适当的应用程序将花费大量时间.
感谢任何帮助!