Ram*_*non 4 python selenium google-chrome-headless
我刚刚开始学习 Selenium,需要使用云中的 jenkins 机器验证登录网页,该机器没有 GUI。我设法在具有 UI 的系统上成功运行该脚本。但是,当我修改脚本以无头运行时,它无法显示无法定位元素。我的脚本如下:
#!/usr/bin/env python3
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from webdriver_manager.chrome import ChromeDriverManager
import time
import argparse
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--window-size=1120, 550')
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument('--allow-running-insecure-content')
driver = webdriver.Chrome(ChromeDriverManager().install(), chrome_options=chrome_options)
driver.implicitly_wait(5)
lhip = '13.14.15.16'
user = 'username'
paswd = 'password'
parser = argparse.ArgumentParser()
parser.add_argument('-i', '--lh_ip', type=str, metavar='', default=lhip, help='Public IP of VM' )
parser.add_argument('-u', '--usr', type=str, metavar='', default=user, help='Username for VM')
parser.add_argument('-p', '--pwd', type=str, metavar='', default=paswd, help='Password for VM')
args = parser.parse_args()
lh_url = 'https://' + args.lh_ip + '/login/'
driver.get(lh_url)
try:
if driver.title == 'Privacy error':
driver.find_element_by_id('details-button').click()
driver.find_element_by_id('proceed-link').click()
except:
pass
driver.find_element_by_id('username').send_keys(args.usr)
driver.find_element_by_id('password').send_keys(args.pwd)
driver.find_element_by_id('login-btn').click()
driver.implicitly_wait(10)
try:
if driver.find_element_by_tag_name('span'):
print('Login Failed')
except:
print('Login Successful')
driver.close()
Run Code Online (Sandbox Code Playgroud)
当不使用 chrome_options 时,python 脚本在我的系统上运行良好。然而,将它们添加到无头模式下运行后,它会失败并显示以下输出:
[WDM] - Current google-chrome version is 85.0.4183
[WDM] - Get LATEST driver version for 85.0.4183
[WDM] - Driver [/home/ramesh/.wdm/drivers/chromedriver/linux64/85.0.4183.87/chromedriver] found in cache
Traceback (most recent call last):
File "/home/ramesh/practice_python/test_headless.py", line 44, in <module>
driver.find_element_by_id('username').send_keys(args.usr)
File "/home/ramesh/.local/lib/python3.6/site-packages/selenium/webdriver/remote/webdriver.py", line 360, in find_element_by_id
return self.find_element(by=By.ID, value=id_)
File "/home/ramesh/.local/lib/python3.6/site-packages/selenium/webdriver/remote/webdriver.py", line 978, in find_element
'value': value})['value']
File "/home/ramesh/.local/lib/python3.6/site-packages/selenium/webdriver/remote/webdriver.py", line 321, in execute
self.error_handler.check_response(response)
File "/home/ramesh/.local/lib/python3.6/site-packages/selenium/webdriver/remote/errorhandler.py", line 242, in check_response
raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"css selector","selector":"[id="username"]"}
(Session info: headless chrome=85.0.4183.121)
Run Code Online (Sandbox Code Playgroud)
由于我学习了大约一天的 Selenium,我可能会做一些相当愚蠢的事情,所以如果有人告诉我我做错了什么,我将非常感激。我用谷歌搜索了很多,尝试了很多东西,但都没有成功。另外,当我只使用 id 作为用户名时,为什么它说“css 选择器”?
我遇到了同样的问题,它最初可以工作,但在我们使用 Selenium 的网站进行更新后,它停止在无头模式下工作,但继续在非无头模式下工作。经过 2 天的研究网络最深和最黑暗的深度以及大量的试验和错误,终于找到了问题所在。
我尝试了网上列出的所有方法以及更多方法,但在我找到这个方法之前都没有任何效果。
在无头 chrome 模式下,用户代理如下所示: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML,如 Gecko) HeadlessChrome /60.0.3112.50 Safari/537.36
服务提供商更新了他们的代码以识别 HeadlessChrome 部分,这会导致选项卡崩溃,进而破坏 Selenium 用户会话。
这导致上述问题在其中一个异常中触发。
为了解决这个问题,我使用了一个名为 fake_headers 的插件(https://github.com/diwu1989/Fake-Headers):
from fake_headers import Headers
header = Headers(
browser="chrome", # Generate only Chrome UA
os="win", # Generate only Windows platform
headers=False # generate misc headers
)
customUserAgent = header.generate()['User-Agent']
options.add_argument(f"user-agent={customUserAgent}")
Run Code Online (Sandbox Code Playgroud)
虽然这只是解决方案的一半,因为我只想要 Windows 和 Chrome 标头,并且 fake_headers 模块不包含最新的 Chrome 浏览器,并且列表中包含许多旧版本的 Chrome,如在此文件中所示https:// github.com/diwu1989/Fake-Headers/blob/master/fake_headers/browsers.py。我运行 Selenium 的特定网站的某些功能仅适用于较新版本的 Chrome,因此当旧版本的 Chrome 通过用户代理标头传递时,该网站上的某些功能实际上会停止工作。因此,我需要更新 fake_headers 模块中的 browsers.py 文件,以仅包含我想要包含的 Chrome 版本。因此,我删除了 Chrome 的所有旧版本,并创建了一个精选版本列表(每个版本都经过单独测试以在相关网站上运行,并删除了不能运行的版本)。最终得到了以下列表,我可以对其进行扩展,但暂时还没有。
chrome_ver = [
'90.0.4430', '84.0.4147', '85.0.4183', '85.0.4183', '87.0.4280', '86.0.4240', '88.0.4324', '89.0.4389', '92.0.4515', '91.0.4472', '93.0.4577', '93.0.4577'
]
Run Code Online (Sandbox Code Playgroud)
希望这可以帮助人们减轻两天的压力和混乱。
有关无头镀铬可检测性的一些更有用的信息: https ://intoli.com/blog/making-chrome-headless-unDetectable/
小智 7
如果脚本在没有无头模式的情况下工作得很好,则窗口大小可能存在问题。除了指定 --no-sandbox 选项外,尝试更改传递给网络驱动程序的窗口大小
chrome_options.add_argument('--window-size=1920,1080')
这个窗口大小适合我的情况。
即使这不起作用,您可能需要添加之前回答的等待计时器,因为与 UI 模式下的浏览器相比,无头模式下的渲染工作方式不同。
无头模式渲染参考 - https://www.toolsqa.com/selenium-webdriver/selenium-headless-browser-testing/
| 归档时间: |
|
| 查看次数: |
10543 次 |
| 最近记录: |