有没有办法通过 Python 加载网页的网络活动(您可以在 Chrome Dev Tools 上看到)?

Zac*_*ach 5 javascript python google-chrome http python-3.x

我想收听网络事件(基本上是您转到 Chrome 开发人员工具/检查上的网络选项卡时可以看到的所有活动)并在通过 Python 加载页面时记录特定事件。

这可能吗?谢谢!

具体来说

  • webpage.com
  • 打开 Chrome Dev Tools 并转到Network选项卡
  • 添加api.webpage.com为过滤器
  • 刷新页面[滚动]

我希望能够捕获这些事件的名称,因为存在无法通过 UI 获得的特定 ID。

ar-*_*qui 6

2021 年更新 我必须对扎克的答案进行一些更改才能使其发挥作用。带有 ### 的评论是我的评论

def get_perf_log_on_load(url, headless=True, filter=None):

    # init Chrome driver (Selenium)
    options = Options()
    options.add_experimental_option('w3c', False) ### added this line
    options.headless = headless
    cap = DesiredCapabilities.CHROME
    cap["loggingPrefs"] = {"performance": "ALL"}
    ### installed chromedriver.exe and identify path
    driver = webdriver.Chrome(r"C:\Users\asiddiqui\Downloads\chromedriver_win32\chromedriver.exe", desired_capabilities=cap, options=options) ### installed
    # record and parse performance log
    driver.get(url)
    if filter:
        log = [item for item in driver.get_log("performance") if filter in str(item)]
    else:
        log = driver.get_log("performance")
    driver.close()

    return log
Run Code Online (Sandbox Code Playgroud)

  • 如果您收到诸如“未找到性能”日志之类的错误。试试这个:/sf/ask/3713431851/ 更改基本上是使用: cap["goog:loggingPrefs"] (2认同)

Zac*_*ach 3

虽然它没有完全回答问题,但 @mihai-andrei 的回答让我最接近。

如果有人正在寻找 Python 解决方案,那么下面的代码应该可以解决问题:

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
from selenium.webdriver.chrome.options import Options

def get_perf_log_on_load(self, url, headless = True, filter = None):

    # init Chrome driver (Selenium)
    options = Options()
    options.headless = headless
    cap = DesiredCapabilities.CHROME
    cap['loggingPrefs'] = {'performance': 'ALL'}
    driver = webdriver.Chrome(desired_capabilities = cap, options = options)

    # record and parse performance log
    driver.get(url)
    if filter: log = [item for item in driver.get_log('performance')
                      if filter in str(item)]
    else: log = driver.get_log('performance')
    driver.close()

    return log
Run Code Online (Sandbox Code Playgroud)