Hel*_*nar 5 recommendation-engine prediction cold-start
我很好奇克服"冷启动"问题的方法/方法是什么,当新用户或项目进入系统时,由于缺乏关于这个新实体的信息,推荐是一个问题.
我可以考虑做一些基于预测的推荐(如性别,国籍等).
Pet*_*r H 23
你可以冷启动推荐系统.
有两种推荐系统; 协同过滤和基于内容.基于内容的系统使用有关您推荐的内容的元数据.那么问题是元数据是什么重要的?第二种方法是协同过滤,它不关心元数据,它只是使用人们对项目所做的或所说的来做出推荐.通过协作过滤,您不必担心元数据中的哪些术语很重要.实际上,您不需要任何元数据来提出建议.协同过滤的问题在于您需要数据.在您有足够的数据之前,您可以使用基于内容的建议.您可以提供基于这两种方法的建议,并且在开始时具有100%基于内容的建议,然后当您获得更多数据时开始混合基于协作过滤.这是我过去使用的方法.
另一种常见技术是将基于内容的部分视为简单的搜索问题.您只需将元数据作为文档的文本或正文放入,然后索引文档.您可以使用Lucene&Solr执行此操作而无需编写任何代码.
如果您想了解基本协同过滤的工作原理,请查看Toby Segaran的"编程集体智慧"第2章
也许有些时候你不应该提出建议?"数据不足"应符合其中一个时间.
我只是看不出基于"性别,国籍等"的预测建议将不仅仅是刻板印象.
IIRC,像亚马逊这样的地方在推出建议之前建立了他们的数据库一段时间.这不是你想要出错的那种东西; 有很多关于基于数据不足的不适当建议的故事.