Python Selenium:当浏览器无头时无法通过 xpath 找到元素

ash*_*ets 7 python selenium-chromedriver selenium-webdriver

我正在尝试使用以下代码使用 Python Selenium 登录网站:

import time
from contextlib import contextmanager
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

@contextmanager
def getBrowser(*options):
    chrome_options = Options()
    if options: [chrome_options.add_argument(option) for option in options]
    browser = webdriver.Chrome(chrome_options=chrome_options)
    try:
        yield browser
    finally:
        browser.quit()


with getBrowser() as browser:
    browser.get('https://www.vinted.com/members/notifications')

    time.sleep(20)
    browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()
Run Code Online (Sandbox Code Playgroud)

它工作得很好,但是当我将--headless选项添加到浏览器时,它会引发一个NoSuchElementException.

错误引发代码:

with getBrowser('--headless') as browser:
    browser.get('https://www.vinted.com/members/notifications')

    time.sleep(20)
    browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()
Run Code Online (Sandbox Code Playgroud)

追溯:

Traceback (most recent call last):

  File "<ipython-input-4-fe0834deb137>", line 1, in <module>
    runfile('C:/Users/Alec/vinted test case.py', wdir='C:/Users/Alec')

  File "C:\Users\Alec\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 705, in runfile
    execfile(filename, namespace)

  File "C:\Users\Alec\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 102, in execfile
    exec(compile(f.read(), filename, 'exec'), namespace)

  File "C:/Users/Alec/vinted test case.py", line 27, in <module>
    browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()

  File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 354, in find_element_by_xpath
    return self.find_element(by=By.XPATH, value=xpath)

  File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 832, in find_element
    'value': value})['value']

  File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 297, in execute
    self.error_handler.check_response(response)

  File "C:\Users\Alec\selenium\webdriver\remote\errorhandler.py", line 194, in check_response
    raise exception_class(message, screen, stacktrace)

NoSuchElementException: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span"}
  (Session info: headless chrome=65.0.3325.181)
  (Driver info: chromedriver=2.36.540470 (e522d04694c7ebea4ba8821272dbef4f9b818c91),platform=Windows NT 10.0.16299 x86_64)
Run Code Online (Sandbox Code Playgroud)

仅当浏览器为无头浏览器时才会出现此错误。是什么导致了这种行为?可以使其在无头模式下工作吗?

目标 HTML:

<div class="u-flex-grow">
      <a class="c-button--inverse c-button--normal c-button--amplified c-button " href="/member/general/login?ref_url=%2Fmembers%2Fnotifications"><span class="c-button__content">Log In</span></a>
    </div>
Run Code Online (Sandbox Code Playgroud)

小智 5

我遇到过同样的问题。解决方案是添加 usr-agent:

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'
chrome_options.add_argument('user-agent={0}'.format(user_agent))
Run Code Online (Sandbox Code Playgroud)

我通过打印页面找到了原因

browser.get(url)
print(browser.page_source)
Run Code Online (Sandbox Code Playgroud)

然后返回 html 说权限拒绝,所以我用谷歌搜索它。遵循解决方案: 如何通过无头驱动程序访问站点而不被拒绝许可


小智 2

我曾经在使用此类工具的版本时遇到过一些麻烦。我通过确保安装了最新版本的 Chrome 和 webdriver 解决了这个问题。也许这是一个类似的问题?

但除此之外,您的选择器还取决于很多元素。因此,想象 html 在无头模式下看起来有点不同可能会导致您的问题。

我会尝试获得一个不太严格的选择器,如下所示://a[starts-with(@href,'/member/general/login?')]

如果这不起作用,请尝试在无头模式下将 html 转储到文件中。只是为了看看无头浏览器看到了什么,并尝试用它构建一个奇特的选择器。