如何获得完美的网页本地副本?

Cap*_*ack 9 web

无论我尝试过什么浏览器(甚至是 Chrome),当将网页保存为本地文件时,它都不太准确。很多 JavaScript 之类的东西似乎都会绊倒它。我正在寻找某种方法来获得 100% 完美的网页本地副本。换句话说,所有 CSS/图像/JavaScript 也应该下拉,并且对所述内容的 HTML 引用应该更改为指向本地文件夹。有没有办法做到这一点?我主要使用 Mac,但我可以访问 Linux。

KCo*_*eau 10

“很多 JavaScript 之类的东西似乎把它绊倒了”的原因可能是很多公司使用内容管理系统(Joomla、Drupal 和 Wordpress),这些系统使用这些系统来查询数据库的内容。如果是这种情况,您将无法获得您想要的整个页面。所以这取决于网页。


Joh*_*n T 6

尝试使用HTTrack下载网站。这些选项允许您配置本地下载文件的链接方式以及下载的内容。可以使用 Windows、Linux 和 Mac 版本。


小智 5

您需要使用 Httrack 下载整个网站(您需要对其进行设置,以便它不下载外部 JavaScript)...只需运行它,然后查看下载的目录,再次运行 Httrack 并排除(fe - .googlesyndicate.com /* - .facebook.net/ -*.google-analytics.com/** 等)

您还可以使用 Wget:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://www.yourdomain.com
Run Code Online (Sandbox Code Playgroud)

完成后,您仍然需要重写所有链接,这样它们就不会指向.../index.html。这解决了Dynamic to Static HTML Converter