下载一个包含所有需要的图形和链接的 pdf/zip 文件的 html 页面

abe*_*thy 5 download wget web

我想从一个 URL 下载一个网站,在本地查看它,更准确地说:

  • 下载一个单独的html 页面(没有其他链接的 html 页面)以及显示它所需的所有内容(css、图像等)
  • 还要下载所有类型为pdf和 的直接链接文件zip
  • 并更正指向它们的所有链接,以便链接在本地工作。
  • 其他链接(例如到 html 文件)应该保持不变。

我对所有基于 linux 的工具持开放态度(macports支持会很好),wget但到目前为止对我来说并没有奏效。

编辑: wget -E -H -k -K -p接近我想要的,但如何包含 pdf 和 zip 文件?(来源: Stackoverflow

小智 1

你尝试过wget -rk -l 1 <sitename>或者类似吗?这应该在将链接转换为相对路径的同时递归地获取内容。最终结果可能是比您想要的更多的 .html 文件,但是您可以删除除 index.html 之外的所有文件,您应该能够正常浏览它。