在登录表单后面镜像网站

ori*_*rip 14 website authentication clone

精简版:

  • 我想捕捉一个 URL 的离线副本,其中包括完整的 HTML+CSS+JS+图像并将它们保存在本地,保留原始站点的结构和文件内容。
  • 我在使用我能找到的工具(例如“保存完整”Firefox 扩展、HTTrack、wget、Teleport Pro)时遇到问题,部分原因是 URL 位于登录表单后面。

更长的版本:

在我的应用程序上工作时,我经常想捕捉一个离线的完整 HTML+CSS+JS+图像版本发送给与我一起工作的设计师,他们进行修改并将其发回。然后我将更改应用到应用程序。

事实证明,这比让他/她使用实时应用浏览我们的代码更有效,但有一个障碍 - 我找不到方便的镜像应用。

像“Save Complete”这样的 Firefox 扩展已经有登录 cookie,所以不在乎它们是否在登录表单后面,但它们会破坏本地保存的文件,使其无法使用它们。

wget 或 Teleport Pro 等镜像工具不支持我们的登录表单。

不过,HTTrack 应该能够在代理模式下运行以检测登录信息,但我永远无法让它工作。作为后备,它可以接受我硬连接到它的 cookies.txt 文件中的 cookie,但它总是需要我几个小时才能可靠地做到这一点。

任何可以做到这一点的工具、浏览器扩展等?开源,商业 - 任何东西。如果我一直在滥用 HTTrack 并且它实际上是微不足道的 - 这也是一个很好的答案。

Sim*_*ast 10

我已经用WinHTTrack成功地做到了这一点。您可以遵循捕获网站的正常程序,并进行两个小设置调整:

  1. 在 Chrome 中,打开 Dev Tools,然后登录到您需要捕获的网站。在“网络”选项卡中,单击您请求的 HTML 页面以查找会话 cookie(其名称将因所使用的后端框架而异)。将其放入“附加 HTTP 标头”下的 HTTrack 中。

  2. 还要确保您的用户代理字符串匹配,因为如果用户代理字符串更改,有时会话会被​​阻止。

    会话 cookie 登录到 HTTrack

  3. 开始下载网站。结果应该就像您已登录一样。


The*_*eLQ 8

使用 HTTrack,您可以在下载时使用 cookies.txt 文件。我已经用它成功地镜像了一个moodle站点。

  • 我所做的是用浏览器登录并导出cookies.txt文件,将注销页面添加到黑名单中,然后让它运行。由于moodle的愚蠢,我尝试了几次,但我让它起作用了 (3认同)

Pab*_*blo 3

您尝试过离线浏览器吗?

我记得类似的东西会让你登录,从而为后续请求保存cookie,并完成剩下的工作。不确定100%,因为我很久以前就使用过它。