相关疑难解决方法(0)

使用 selenium 和 python 等待表完全加载

我想从表格中的页面中抓取一些数据。所以我只关心表中的数据。之前我在使用 Mechanize,但我发现有时会丢失一些数据,尤其是在表格底部。谷歌搜索,我发现这可能是由于机械化没有处理 Jquery/Ajax。

所以我今天改用 Selenium。如何等待一个且只有一个表完全加载,然后使用 selenium 和 python 从该表中提取所有链接?如果我等待完整页面加载,则需要一些时间。我想确保只加载表中的数据。我目前的代码:

驱动程序 = webdriver.Firefox()
对于范围(1, 2)中的页面:
    driver.get("http://somesite.com/page/"+str(page))
    table = driver.find_element_by_css_selector('div.datatable')
    links = table.find_elements_by_tag_name('a')
    对于链接中的链接:
        打印链接.文本

python selenium web-scraping selenium-webdriver

4
推荐指数
1
解决办法
1万
查看次数