Mil*_*ano 4 python selenium parsing web-scraping selenium-webdriver
我是 Python 的 Selenium 新手。我正在尝试抓取一些数据,但我不知道如何解析这样的命令的输出:
driver.find_elements_by_css_selector("div.flightbox")
Run Code Online (Sandbox Code Playgroud)
我试图用谷歌搜索一些教程,但我没有找到 Python 的任何内容。
你能给我一个提示吗?
find_elements_by_css_selector()会返回给你一个实例列表WebElement。每个 Web 元素都有许多可用的方法和属性。例如,要获取元素的内部文本,请使用.text:
for element in driver.find_elements_by_css_selector("div.flightbox"):
print(element.text)
Run Code Online (Sandbox Code Playgroud)
您还可以进行特定于上下文的搜索以查找当前元素内的其他元素。考虑到我知道您在使用哪个站点,这里有一个示例代码,用于在结果框中获取第一程航班的出发和到达时间:
for result in driver.find_elements_by_css_selector("div.flightbox"):
departure_time = result.find_element_by_css_selector("div.departure p.p05 strong").text
arrival_time = result.find_element_by_css_selector("div.arrival p.p05 strong").text
print [departure_time, arrival_time]
Run Code Online (Sandbox Code Playgroud)