use*_*836 12 screen-scraping web
我读过这三个用于网页抓取.但最重要的是什么?在什么样的环境中比另一个更好?
Dr *_*ang 20
Nodejs是基于Chrome V8引擎的脚本引擎.Nodejs通常用作Web服务器,但它实际上是一个脚本引擎,可以运行您喜欢的任何类型的脚本.通过向其他服务器发出请求然后分析输出,可以将节点用于Web抓取.
Phantomjs是一个无头webkit浏览器,这意味着它就像浏览器一样,但没有UI.单独使用,它构成了Web测试框架的一部分,但更好地用于...
Casperjs是一个基于Phantomjs构建的实用程序,可帮助您构建自动化测试.
自动化测试可以看作是一个网络刮板,但这并不是它真正的用途.Web测试通常对正在被抓取的页面上的更改敏感,并且不必快速进行DOM操作(因为您倾向于一次执行一个页面).
我认为nodejs可能是你想要的最好的.
归档时间: |
|
查看次数: |
4345 次 |
最近记录: |