刮网并将网站转换为HTML?

Kev*_*vin 8 html screen-scraping web-scraping

我还没有在3到4年内完成这项工作,但客户希望将其动态网站降级为静态HTML.

是否有任何免费工具可以抓取域并生成有效的HTML文件以使其快速无痛?

编辑:如果这很重要,那就是Coldfusion网站.

Pek*_*ica 9

Getleft是一个很好的Windows客户端,可以做到这一点.它非常可配置且可靠.

Wget也可以--mirror选择.


Bor*_*lid 6

尝试使用httrack(或webhttrack/ winhttrack,如果你想要一个GUI)蜘蛛网站.它是免费的,快速的,可靠的.它也比原始的下载器更强大wget; httrack专为镜像网站而设计.

请注意,将动态页面转换为静态页面会失去很多功能.它也并非总是可行 - 动态站点可以呈现无数个不同的静态页面.