Joh*_*ohn 110
Google不允许在其服务条款中自动访问,因此如果您接受他们的条款,您就会破坏它们.
也就是说,我知道Google不会对刮刀提起诉讼.即便是微软也不顾谷歌,他们用自己的搜索引擎Bing推动了它.他们在2011年被红色抓住了 :)
刮取Google搜索结果有两种选择:
1)使用他们的API
您每小时可以发出大约40个请求您只能看到他们给您的内容,如果您想跟踪排名位置或真实用户会看到什么,这并不是很有用.这是你不被允许收集的东西.
如果您需要更高数量的API请求,则需要付费.
2)刮取正常结果页面
3)或者使用抓取服务(更新)
Sev*_*rin 50
当您超过一定数量的请求时,Google最终会阻止您的IP.
rag*_*hav 13
谷歌在抓取世界上的网站上茁壮成长……所以如果它“如此非法”,那么即使是谷歌也无法生存……当然其他答案提到了谷歌减轻 IP 封锁的方法。探索避免验证码的另一种方法可能是随机抓取(尝试)..此外,我有一种感觉,如果我们提供新颖性或一些重要的数据处理,那么至少对我来说听起来不错......如果我们只是简单地复制一个网站......或以某种方式阻碍其业务/品牌......那么这是不好的,应该避免......最重要的是......如果你是一家初创公司,那么没有人会像那里那样与你抗争没有任何好处......但是如果你的整个前提是在你获得资金的情况下进行抓取,那么你应该考虑更复杂的方法......替代API......最终......
| 归档时间: |
|
| 查看次数: |
90891 次 |
| 最近记录: |