如何使用 JavaScript 菜单镜像站点?

zou*_*oul 5 html javascript wget mirroring

I\xe2\x80\x99m 试图镜像一个使用客户端生成的疯狂 JavaScript 菜单的网站。两者wgethttrack无法下载整个站点,因为在 JS 代码运行之前链接根本不存在。我能做些什么?

\n\n

我尝试将主索引页面加载到浏览器中。它运行 JS 代码,构建菜单,然后我可以将生成的 DOM 转储到 HTML 文件中并从此文件进行镜像。这会下载更多文件,因为链接已经在源中。但显然,镜像很快就会在其他新下载的包含未解释的 JS 菜单的页面上中断。

\n\n

我考虑过用菜单的静态版本替换每个下载页面的菜单部分,但我无法\xe2\x80\x99找到任何wgethttrack标志,可以让我通过外部命令运行下载的文件。我可以编写一个简单的过滤代理,但这听起来有点极端。还有其他想法吗?

\n

Mat*_*ves 2

即使在动态元素混淆的网站上,我也使用HtmlUnit取得了巨大成功。