我使用此命令以 5 个级别递归下载网页以进行离线导航:
wget -r -p --convert-links http://www.pythondiario.com
Run Code Online (Sandbox Code Playgroud)
但图像未正确下载。
我该如何解决?
正如Sat\xc5\x8d Katsura在评论中指出的那样,此页面上的某些图像位于不同的主机上。默认情况下,wget 不遵循跨主机链接(这适用于图像检索以及递归遍历)。
\n\n要使 wget 遵循跨主机链接,请传递该-H
选项。建议-D
同时传递该选项来限制遍历哪些主机,否则您将面临下载大量链接内容的风险。
wget -r -p --convert-links -H -Dblogspot.com http://www.pythondiario.com\n
Run Code Online (Sandbox Code Playgroud)\n\n请注意,-H
和-D
适用于递归遍历以及图像。-R
您可以通过添加或选项进一步限制跨主机链接--reject-regex
。
有关更多详细信息,请参阅手册中的 \xe2\x80\x9cspanninghosts\xe2\x80\x9d 。
\n 归档时间: |
|
查看次数: |
6534 次 |
最近记录: |