如何正确设置 wget 以仅下载新文件?

Ric*_*uez 51 linux terminal wget

假设有一个网址,我们称之为 http://www.some-url.com/folder/

此位置已启用目录列表,因此我可以执行以下操作:

wget -r -np http://www.some-url.com/folder/
Run Code Online (Sandbox Code Playgroud)

下载所有文件和子文件夹及其文件的所有内容。

现在,如果我想在一个月后再次重复此过程,并且不想再次下载所有内容,只添加新的/更改的文件,我该怎么办?

use*_*274 66

你读过这个吗?http://www.editcorp.com/Personal/Lars_Appel/wget/wget_5.html

“几天后,您希望 Wget 检查远程文件是否已更改,如果已更改,则下载它。”

wget -N http://www.some-url.com/folder/
Run Code Online (Sandbox Code Playgroud)

尝试这个。

  • 但是,如果检索到的文件没有 Last-Modified 标头,则 -N 是无用的。 (8认同)

小智 20

wget -c 
Run Code Online (Sandbox Code Playgroud)

还会继续下载出现问题时导致的部分文件......
更好的是,

 wget -c -N 
Run Code Online (Sandbox Code Playgroud)

似乎同时进行。

  • 我可以确认 Matt Williamson 的观察结果,使用“-c”标志会抵消“-N”的效果,这意味着不会下载较新的文件。 (2认同)