Igo*_*kin 6 screen-scraping web-scraping web
如何找出我的网站正在刮?
我有点意见......
你会在这个列表中添加更多内容吗?
如果刮刀使用代理,可能适合/匹配哪些点?
我还会添加对同一个人何时提出请求的分析。例如,如果同一 IP 地址每天在同一时间请求相同的数据,则该过程很可能是按照自动计划进行的。所以很可能会被刮...
可能添加对每个用户会话影响的页面数量的分析。例如,如果特定用户在特定日期浏览了您网站中的每个页面,并且您认为这不寻常,那么可能是另一个指标。
感觉就像您需要一系列指标,并且需要对它们进行评分,并将分数结合起来以显示谁最有可能进行抓取。