如何从wget获取真实的文件名

Question

我正在编写一个bash脚本并使用wget从网站中检索一些PDF文件.例如:

wget www.barb.co.uk/news/item-subscriber/id/213/index.html

但是wget将文件保存为index.html.如果我在浏览器中输入该URL,则会正确下载该文件的真实姓名 - "BARB Bulletin 25 - December 10.pdf".

如何让wget做同样的事情？或者是否有另一种方法可以找到文件的真实名称(来自bash脚本)？

Answer 1

您可以使用--content-disposition选项使wget更加复杂地查看HTTP响应的标头,这在大多数情况下都有帮助.

例:

wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html