use*_*729 1 web-services information-retrieval advertisement-server
为了每次都展示最佳匹配广告,至少要做以下事情:
但对于非搜索引擎公司而言,上述几乎是不可能的.
那么非谷歌公司采用最佳匹配广告系统的实用方法是什么?
你基本上不能实时做点1 - 时间间隔太短.因此,您需要事先分析您要投放广告的所有网页,并以能够在广告投放时快速访问的方式存储该信息.
这并不一定意味着"成为一家搜索引擎公司":毕竟,您可能不会在数十亿个不同的网址上投放广告,而只会在属于贵公司或其合作伙伴的少得多的网址上投放广告(因此,您可以从URL所有者处获得协作:例如,您不需要通用蜘蛛,但可以依靠使用sitemaps协议的所有者来让您了解新的,更新的或删除的URL,您可以信任每个页面的关键字,标题和标题,以提供重要信息,等等).
因此,使用相对较少数量的服务器(比如几十个,可能在EC2或其他"云"服务中),您可以将内存分布式哈希表映射到(例如)相关关键字集和关键字权重集(例如)相对重要性,以及候选广告的类似表格 - 事实上,如果您的系统没有"实时拍卖"方面,您甚至可能会预先计算网址与广告的对应关系(可能是您做的)想要做一些动态调整,拍卖方式或其他,但有一些合理的近似,可以建模为预先计算的对应的简单增量操作).
如果您确实需要扩展到在数十亿个网址上投放广告,那么您确实需要一种比在SO答案中有效总结的更复杂的方法 - 但是,如果这是您的野心的规模,那么最好放在一起一个没有被任务吓倒的工程团队(远远超过几十台服务器;-).
归档时间: |
|
查看次数: |
308 次 |
最近记录: |