HTTrack 提供了过滤器选项,但我无法弄清楚如何下载某个子文件夹级别并忽略所有其他子文件夹。
例子:
domain.com/
domain.com/pets/
domain.com/pets/elephant
domain.com/zoo/tiger
domain.com/pics/giraffe
domain.com/pics/giraffe/details
Run Code Online (Sandbox Code Playgroud)
我只想下载子文件夹elephant,tiger并giraffe以 HTML 形式下载,包括从那里链接的图像。
HTTrack有那么强大吗?(我使用的是 Windows GUI 版本“WinHTTrack”。)
PS:如果能将其作为程序选项就好了,例如“最小镜像深度”。
我尝试使用httrack下载我的 phpbb 论坛,但无论我使用什么设置,我都无法停止下载整个维基百科网站,以及链接位于论坛任何位置的许多其他网站...
我设法做到的让它只下载索引页面,但这也不好。
我以为设置
+forum.mysite.com/*
Run Code Online (Sandbox Code Playgroud)
在选项->扫描规则中可以解决问题,但它继续再次下载整个维基百科:(
httrack ×2