如何在服务器上运行 selenium 脚本

Arr*_*let 2 python selenium vps

我有个问题。是否可以在服务器(amazon ec2)上运行 python 脚本,该脚本使用 selenium 从动态网站中抓取数据。我多次试图找到有关此的一些信息,但这没有结果。

谢谢大家!

fur*_*ras 6

服务器不使用 GUI/Windows,甚至没有显示器。它被称为“无头”服务器(因为监视器看起来像服务器的头部)

Selenium 运行需要 GUI/Windows 来显示其窗口的 Web 浏览器。

但是一些网络浏览器也可以在不显示窗口的情况下运行——它们可以运行headless.

 from selenium.webdriver.chrome.options import Options  

 chrome_options = Options()  
 chrome_options.add_argument("--headless")  

 driver = webdriver.Chrome(chrome_options=chrome_options)  
Run Code Online (Sandbox Code Playgroud)

对于 Firefox 应该是类似的代码。

还有 Selenium 的 webdrive PhantomJS,它可以无头工作,但不再开发。

Linux 也有Xvfb程序,它可以在无头计算机上创建假/虚拟监视器,它可以运行没有 GUI/XWindows 就无法运行的程序。

我没有检查它,但其中一种方法可能适用于 Amazon EC2。