小编Nad*_*xan的帖子

检索完整的网页,包括动态加载的链接/图像

问题

下载动态加载链接/图像的网站的完整工作离线副本

研究

Stackoverflow 上有一些问题(例如[1][2][3])解决了这个问题,其中大多数都使用wgethttrack得到了最佳答案,但这两个问题都惨遭失败(如果我错了,请纠正我)在动态加载链接或使用srcset而不是srcforimg标签或通过 JS 加载的任何内容的页面上。一个相当明显的解决方案是Selenium,但是,如果您曾经在生产中使用过 Selenium ,您很快就会开始看到这种决定所带来的问题(资源繁重,使用全头驱动程序相当复杂,事实上它不是为那),话虽这么说,有人声称多年来一直在生产中轻松使用它

预期解决方案

一个脚本(最好是Python),用于解析页面中的链接并单独加载它们。我似乎找不到任何现有的脚本可以做到这一点。如果您的解决方案是“因此实现您自己的”,那么首先提出这个问题是毫无意义的,我正在寻求现有的实现。

例子

  1. Shopify.com
  2. 使用 Wix 构建的网站

python selenium wget web-scraping httrack

5
推荐指数
1
解决办法
1407
查看次数

发件人地址被拒绝。Django + 网络派系电子邮件

我使用的代码是什么我上找到webfaction

EMAIL_HOST = 'smtp.webfaction.com'
EMAIL_HOST_USER = '<mailbox name>'
EMAIL_HOST_PASSWORD = '<mailbox pass>'
DEFAULT_FROM_EMAIL = '<email address>'
SERVER_EMAIL = '<email address>'
Run Code Online (Sandbox Code Playgroud)

我不断收到错误 SMTPRecipientsRefused

发件人地址被拒绝:需要完全合格的地址

python django webfaction

2
推荐指数
2
解决办法
3221
查看次数

标签 统计

python ×2

django ×1

httrack ×1

selenium ×1

web-scraping ×1

webfaction ×1

wget ×1