如何从wget获取真实的文件名

Pet*_*owe 4 bash filenames wget

我正在编写一个bash脚本并使用wget从网站中检索一些PDF文件.例如:

wget www.barb.co.uk/news/item-subscriber/id/213/index.html
Run Code Online (Sandbox Code Playgroud)

但是wget将文件保存为index.html.如果我在浏览器中输入该URL,则会正确下载该文件的真实姓名 - "BARB Bulletin 25 - December 10.pdf".

如何让wget做同样的事情?或者是否有另一种方法可以找到文件的真实名称(来自bash脚本)?

hoe*_*eni 14

您可以使用--content-disposition选项使wget更加复杂地查看HTTP响应的标头,这在大多数情况下都有帮助.

例:

wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html
Run Code Online (Sandbox Code Playgroud)

  • 您可以通过将`content_disposition = on`添加到`〜/ .wgetrc`文件来使其成为默认值. (2认同)