小编Con*_*rad的帖子

相当于Python中的wget下载网站和资源

2.5年前在下载一个网页及其所有资源文件的问题上也发生了同样的事情,但没有得到答案,"请看相关主题"并不是真的在问同样的事情.

我想下载页面上的所有内容,以便只从文件中查看它.

命令

wget --page-requisites --domains = DOMAIN --no-parent --html-extension --convert-links --restrict-file-names = windows

完全是我需要的.但是我们希望能够将其与其他必须可移植的东西联系起来,因此需要它在Python中.

我一直在看美丽的汤,scrapy,各种蜘蛛贴在这个地方,但这些都似乎处理以巧妙但具体的方式获取数据/链接.使用这些来做我想要的事情似乎需要大量工作来处理找到所有资源,当我确定必须有一个简单的方法.

非常感谢

python wget web-crawler

6
推荐指数
1
解决办法
7582
查看次数

标签 统计

python ×1

web-crawler ×1

wget ×1