标签: wget

如何用wget指定位置?

我需要将文件下载到/ tmp/cron_test /.我的wget代码是

wget --random-wait -r -p -nd -e robots=off -A".pdf" -U mozilla http://math.stanford.edu/undergrad/
Run Code Online (Sandbox Code Playgroud)

那么是否有一些参数来指定目录?

wget

643
推荐指数
4
解决办法
51万
查看次数

通过wget在Linux上下载Java JDK会显示许可证页面

当我尝试从Oracle下载Java时,我最终下载了一个页面,告诉我需要同意OTN许可条款.

抱歉!

要从Oracle Technology Network下载产品,您必须同意OTN许可条款.

一定要......

  • 您的浏览器已启用"cookies"和JavaScript.
  • 您单击了要接受的产品的"接受许可".
  • 您在接受许可后的30分钟内尝试下载.

我如何下载和安装Java?

java linux install wget

602
推荐指数
11
解决办法
42万
查看次数

使用wget以递归方式获取包含任意文件的目录

我有一个web目录,我存储一些配置文件.我想使用wget来拉下这些文件并保持它们当前的结构.例如,远程目录如下所示:

http://mysite.com/configs/.vim/
Run Code Online (Sandbox Code Playgroud)

.vim拥有多个文件和目录.我想使用wget在客户端上复制它.似乎找不到正确的wget标志组合来完成这项工作.有任何想法吗?

shell wget

545
推荐指数
12
解决办法
66万
查看次数

wget命令下载文件并另存为不同的文件名

我正在使用该wget命令下载文件.但是当它下载到我的本地机器时,我希望它保存为不同的文件名.

例如:我正在下载文件 www.examplesite.com/textfile.txt

我想用来wget将文件保存textfile.txt在我的本地目录中newfile.txt.我使用的wget命令如下:

wget www.examplesite.com/textfile.txt
Run Code Online (Sandbox Code Playgroud)

wget download

491
推荐指数
6
解决办法
48万
查看次数

如何通过Wget浏览登录页面?

我正在尝试使用Wget下载页面,但我无法通过登录屏幕.

如何使用登录页面上的帖子数据发送用户名/密码,然后以经过身份验证的用户身份下载实际页面?

wget

250
推荐指数
9
解决办法
26万
查看次数

从谷歌驱动器wget/curl大文件

我正在尝试从脚本中的谷歌驱动器下载文件,我在这方面遇到了一些麻烦.我正在尝试下载的文件在这里.

我在网上看了很多,我终于设法让其中一个下载了.我得到了文件的UID和较小的(1.6MB)下载,但较大的文件(3.7GB)总是重定向到一个页面,询问我是否要在没有病毒扫描的情况下继续下载.有人可以帮助我通过那个屏幕吗?

这是我如何使第一个文件工作 -

curl -L "https://docs.google.com/uc?export=download&id=0Bz-w5tutuZIYeDU0VDRFWG9IVUE" > phlat-1.0.tar.gz
Run Code Online (Sandbox Code Playgroud)

当我在另一个文件上运行相同的时候,

curl -L "https://docs.google.com/uc?export=download&id=0Bz-w5tutuZIYY3h5YlMzTjhnbGM" > index4phlat.tar.gz
Run Code Online (Sandbox Code Playgroud)

我得到以下输出 - 在此输入图像描述

我注意到链接中的倒数第三行,&confirm=JwkK其中有一个随机的4个字符串,但建议有一种方法可以向我的URL添加确认.我访问过的其中一个链接建议&confirm=no_antivirus但是这不起作用.

我希望有人可以帮忙解决这个问题!

提前致谢.

curl wget google-docs google-drive-api

247
推荐指数
22
解决办法
25万
查看次数

如何为wget设置代理?

我想wget使用代理下载一些东西:

HTTP Proxy: 127.0.0.1
Port: 8080
Run Code Online (Sandbox Code Playgroud)

代理不需要用户名和密码.

我怎样才能做到这一点?我查了很多网站和很多建议,但没有什么对我有用......

linux proxy wget

208
推荐指数
11
解决办法
53万
查看次数

下载网页的工作本地副本

我想下载一个网页的本地副本,并获取所有的CSS,图像,JavaScript等.

在之前的讨论中(例如,这里这里,两者都超过两年),通常提出两个建议:wget -phttrack.但是,这些建议都失败了.我非常感谢使用这些工具中的任何一个来完成任务; 替代品也很可爱.


选项1: wget -p

wget -p成功下载所有网页的先决条件(css,images,js).但是,当我在Web浏览器中加载本地副本时,该页面无法加载先决条件,因为尚未从Web上的版本修改这些先决条件的路径.

例如:

  • 在页面的html中,<link rel="stylesheet href="/stylesheets/foo.css" />需要更正指向新的相对路径foo.css
  • 在css文件中,background-image: url(/images/bar.png)同样需要进行调整.

有没有办法修改,wget -p以便路径正确?


选项2:httrack

httrack对于镜像整个网站来说,它似乎是一个很棒的工具,但我不清楚如何使用它来创建单个页面的本地副本.httrack论坛中有很多关于这个主题的讨论(例如这里),但似乎没有人有防弹解决方案.


选项3:另一个工具?

有些人建议使用付费工具,但我无法相信那里没有免费的解决方案.

非常感谢!

wget download offline-browsing

199
推荐指数
1
解决办法
18万
查看次数

wget下载多个同时连接

我正在使用wget下载网站内容,但是wget逐个下载文件.

如何使用4个同时连接进行wget下载?

wget download

194
推荐指数
11
解决办法
20万
查看次数

如果wget中存在文件,请跳过下载?

这是运行wget的最简单示例:

wget http://www.example.com/images/misc/pic.png
Run Code Online (Sandbox Code Playgroud)

但如果pic.png已经可用,如何使wget跳过下载?

parameters wget download command-line-interface

178
推荐指数
4
解决办法
12万
查看次数