rog*_*rhp -3 php screen-scraping block ip-address
你好我想屏幕刮一个像yelp的网站来获取意大利餐馆的电话号码..我创建了一个简单的程序来做我想要的但他们阻止了我的服务器ip
我正在使用php来做到这一点.我如何通过ip块?
我听说过像屏幕刮刀这样的程序,但我还没有使用它
最好的方法是什么?是否有可能使用屏幕刮刀与PHP?
请注意*这是我正在进行的个人项目,不是为了创建一个企业
如果你这样做是出于商业利益,那就停在你身边.看看你是否能找到获得相同数据的许可方式,或自己砸人行道.有些公司故意在他们的信息中注入错误或可识别的拼写错误,作为捕捉像您这样的人的一种方式,并采取法律措施来保护他们的知识产权(即使这些信息在任何其他方式收集时完全免费).便宜有时最终会变得非常昂贵.
如果您不是为了商业利益而做这件事(并且您真的很喜欢意大利食品),请移动服务器或等到IP块升级(可能永远不会).重写你的代码,并在你的请求上设置一个大规模的速率限制器(模拟用户并每隔5-10秒左右获取一个页面.在短时间内将网站刮过几天.如果他们看到来自单个IP的请求过多太短的时间,他们会再次将你列入黑名单.如果你是他们,你也会.
| 归档时间: |
|
| 查看次数: |
2254 次 |
| 最近记录: |