Axx*_*err 376
HTTRACK就像复制整个网站内容的冠军一样。该工具甚至可以获取使具有活动代码内容的网站脱机工作所需的部分。我对它可以离线复制的东西感到惊讶。
该程序将满足您的所有要求。
狩猎快乐!
Jon*_*nik 313
Wget是用于此类任务的经典命令行工具。它随大多数 Unix/Linux 系统一起提供,您也可以在 Windows 上获得它。在 Mac 上,Homebrew是最简单的安装方法 ( brew install wget)。
你会做这样的事情:
wget -r --no-parent http://site.com/songs/
Run Code Online (Sandbox Code Playgroud)
有关更多详细信息,请参阅Wget 手册及其示例,或例如这些:
小智 186
使用 wget:
wget -m -p -E -k www.example.com
Run Code Online (Sandbox Code Playgroud)
选项说明:
-m, --mirror Turns on recursion and time-stamping, sets infinite
recursion depth, and keeps FTP directory listings.
-p, --page-requisites Get all images, etc. needed to display HTML page.
-E, --adjust-extension Save HTML/CSS files with .html/.css extensions.
-k, --convert-links Make links in downloaded HTML point to local files.
-np, --no-parent Don't ascend to the parent directory when retrieving
recursively. This guarantees that only the files below
a certain hierarchy will be downloaded. Requires a slash
at the end of the directory, e.g. example.com/foo/.
Run Code Online (Sandbox Code Playgroud)
Internet 下载管理器有一个 Site Grabber 实用程序,有很多选项 - 它可以让您以您想要的方式完全下载您想要的任何网站。
您可以设置要下载的页面/文件的大小限制
您可以设置要访问的分支站点的数量
您可以更改脚本/弹出窗口/重复项的行为方式
您可以指定一个域,只有在该域下所有符合要求设置的页面/文件才会被下载
链接可以转换为离线链接浏览
您有模板,可让您为您选择上述设置

但是,该软件不是免费的 - 看看它是否适合您的需求,请使用评估版。
我将解决浏览器使用的在线缓冲...
通常,大多数浏览器使用浏览缓存来保留您从网站下载的文件一段时间,这样您就不必一遍又一遍地下载静态图像和内容。在某些情况下,这可以大大加快速度。一般来说,大多数浏览器缓存都被限制在一个固定的大小,当达到这个限制时,它会删除缓存中最旧的文件。
ISP 往往拥有缓存服务器,用于保存 ESPN 和 CNN 等常用网站的副本。这让他们省去了每次他们网络上有人访问这些站点时访问这些站点的麻烦。这可以显着节省向 ISP 发送外部站点的重复请求数量。
| 归档时间: |
|
| 查看次数: |
949967 次 |
| 最近记录: |