flo*_*ree 10 python selenium qwebview phantomjs
我想加载一个网页并列出该页面的所有加载资源(javascript/images/css).我使用此代码加载页面:
from selenium import webdriver
driver = webdriver.PhantomJS()
driver.get('http://example.com')
Run Code Online (Sandbox Code Playgroud)
上面的代码工作得很好,我可以对HTML页面进行一些处理.问题是,如何列出该页面加载的所有资源?我想要这样的东西:
['http://example.com/img/logo.png',
'http://example.com/css/style.css',
'http://example.com/js/jquery.js',
'http://www.google-analytics.com/ga.js']
Run Code Online (Sandbox Code Playgroud)
我也打开其他解决方案,比如使用PySide.QWebView模块.我只想列出页面加载的资源.
webdribver 中没有可以返回网页所有资源的函数,但您可以执行以下操作:
from selenium.webdriver.common.by import By
images = driver.find_elements(By.TAG_NAME, "img")
Run Code Online (Sandbox Code Playgroud)
脚本和链接也是如此。
| 归档时间: |
|
| 查看次数: |
4380 次 |
| 最近记录: |