ben*_*ato 6 python selenium selenium-webdriver
我正在尝试使用 Python 中的 Selenium Webdriver 从 URL 下载图像。该站点受登录页面保护,因此不能仅使用请求保存 URL 内容。登录后我可以从站点获取文本,但我不知道如何保存图像。
登录该站点后,我可以执行此操作,browser.save_screenshot(filename + '.png')但该图像与原始图像的大小不正确。
我现在拥有的代码是这样的:
browser = webdriver.Chrome('../chromedriver')
browser.get('www.example.com/login')
# send username and password, click submit
browser.get('www.example.com/123')
html = browser.page_source
printData(html)
# this url is an image file
browser.get('www.example.com/get_photo.php?id=123')
browser.save_screenshot(filename + '.png')
Run Code Online (Sandbox Code Playgroud)
理想情况下,我想用类似的save_screenshot()东西替换
with open(filename + '.jpeg', 'w') as img:
img.write(browser.download_current_image())
Run Code Online (Sandbox Code Playgroud)
甚至像这样的东西,与弹出菜单交互
browser.right_click()
browser.down_arrow_key()
browser.return_key()
Run Code Online (Sandbox Code Playgroud)
或模拟按键
browser.command_key()
browser.s_key()
Run Code Online (Sandbox Code Playgroud)
这个问题给出了我想要的答案,但不适用于 Python。如果有办法在 Python 中执行该问题中建议的任何操作(除了截屏),那将是一个很好的解决方案。
这是我用来从登录页面后面的 URL 下载图像的方法,方法是使用 Selenium Webdriver 登录,然后将 cookie 传递给保存图像的请求:
headers = {
"User-Agent":
"Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36"
}
s = requests.session()
s.headers.update(headers)
for cookie in browser.get_cookies():
c = {cookie['name']: cookie['value']}
s.cookies.update(c)
r = s.get(imgurl, allow_redirects=True)
open(filename + '.jpeg', 'wb').write(r.content)
Run Code Online (Sandbox Code Playgroud)
感谢AldoSuwandi在这篇文章中向我展示了如何做到这一点。我还使用这个网站来帮助我弄清楚如何使用请求下载图像。
| 归档时间: |
|
| 查看次数: |
6612 次 |
| 最近记录: |