从PHP中的View计数器中排除机器人和蜘蛛

Jas*_*vis 7 php ads web-crawler

我已经为PHP网站建立了一个非常基本的广告管理器.

我说基本是因为它不像Google或Facebook广告那样复杂,甚至不是大多数高端广告服务器.不处理付款或任何事情,甚至不针对用户.

它适用于我的低流量网站,但只是展示随机横幅广告,计算展示次数和点击次数.

特征:

  • 广告位/页面上的位置
  • 横幅图像
  • 名称
  • 查看/印象计数器
  • 点击计数器
  • 开始和结束日期,或永无止境
  • 禁用/启用广告

我想逐渐为系统添加更多功能.

我注意到的一件事是Impressions/views计数器通常看起来很夸张.

我相信其原因来自社交网络的蜘蛛和机器人以及搜索引擎蜘蛛.

例如,如果有人从我的网站上的页面输入URL到Facebook,Google +,Twitter,LinkedIn,Pinterest和其他网络,那些网站通常会占用我的网站来收集网页标题,图像和描述.

我真的希望能够在实际人员没有查看页面时禁用此计数作为广告印象/视图计数.

我意识到这将很难检测到所有这些,但如果有办法获得大多数这些,至少它会使我的统计数据更准确一些.

所以我正在寻求有关如何实现目标的任何帮助或想法?请不要说使用其他广告系统,不在卡片中,谢谢

在此输入图像描述

Cod*_*gry 11

您需要使用JavaScript为AD提供服务.这是避免大多数抓取工具的唯一方法.只有浏览器加载图像,JS和CSS等依赖项.99%的机器人都避开它们.

你也可以这样做:

// basic crawler detection and block script (no legit browser should match this)
if(!empty($_SERVER['HTTP_USER_AGENT']) and preg_match('~(bot|crawl)~i', $_SERVER['HTTP_USER_AGENT'])){
    // this is a crawler and you should not show ads here
}
Run Code Online (Sandbox Code Playgroud)

你会用这种方式获得更好的统计数据.将JS用于广告.

PS:你也可以尝试在JS中设置一个cookie,然后再检查它.爬虫可能会通过HTTP获得用PHP发送的cookie但是JS中设置的那些,99.9%的可能性他们会错过它.因为他们需要加载JS文件并解释它.这只是由浏览器完成的.