2.5年前在下载一个网页及其所有资源文件的问题上也发生了同样的事情,但没有得到答案,"请看相关主题"并不是真的在问同样的事情.
我想下载页面上的所有内容,以便只从文件中查看它.
命令
wget --page-requisites --domains = DOMAIN --no-parent --html-extension --convert-links --restrict-file-names = windows
完全是我需要的.但是我们希望能够将其与其他必须可移植的东西联系起来,因此需要它在Python中.
我一直在看美丽的汤,scrapy,各种蜘蛛贴在这个地方,但这些都似乎处理以巧妙但具体的方式获取数据/链接.使用这些来做我想要的事情似乎需要大量工作来处理找到所有资源,当我确定必须有一个简单的方法.
非常感谢