使用"下一步"按钮Python进行Web Scraping

Pyt*_*234 1 python selenium beautifulsoup python-2.7

我正在收到网页评论,需要扫描每个页面,直到不再有任何评论为止.评论页面有多个页面,我的第一个想法是使用While循环,但是,我不确定从哪里开始.网页的HTML代码看起来与此类似. 在此输入图像描述

最后一页的HTML代码;在此输入图像描述

任何帮助表示赞赏.

And*_*son 5

尝试点击Next可以找到它:

from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException

driver = webdriver.Firefox()
driver.get("http://www.some_site.com")
while True:
    # do whatever you want
    try:
        driver.find_element_by_xpath('//a/span[text()="Next"]').click()
    except NoSuchElementException:
        break
Run Code Online (Sandbox Code Playgroud)