我正在尝试使用以下命令下载整个网页
wget -p -k www.myspace.com/
Run Code Online (Sandbox Code Playgroud)
这确实下载了该目录下的页面和任何图像或脚本,但我正在试图找出如何下载该页面以完全脱机查看.如何在www.myspace.com的源代码中链接每个图像,脚本和样式表,包括外部链接?
wget -e robots=off -H -p -k http://www.myspace.com/
Run Code Online (Sandbox Code Playgroud)
-H或--span-hosts标志是完整镜像所必需的,因为该页面可能包含www.myspace.com域外的主机上的内容.忽略机器人以获得良好的效果.
| 归档时间: |
|
| 查看次数: |
3788 次 |
| 最近记录: |