Scrapy或Selenium或Mechanize来刮取网页数据?

asi*_*hal 11 mechanize scrapy web-scraping selenium-webdriver

我想从网站上抓一些数据.

基本上,该网站有一些表格显示,显示约50条记录.要获得更多记录,用户必须单击某个按钮进行ajax调用get并显示接下来的50条记录.

我以前有过Selenium webdriver(Python)的知识.我可以在Selenium中快速完成这项工作.但是,Selenium是一种更自动化的测试工具,它非常慢.

我做了一些研发,发现使用Scrapy或Mechanize,我也可以做同样的事情.

我应该为此选择Scrapy或Mechanize或Selenium吗?

Sev*_*rin 8

我建议你使用Mechanize和ExecJS(https://github.com/sstephenson/execjs)的组合来执行你可能遇到的任何javascript请求.我已经将这两颗宝石结合使用了很长一段时间,它们做得很好.

您应该选择此而不是Selenium,因为与必须在无头浏览器中呈现整个页面相比,它会快得多.