1 math statistics voting rating-system
我即将开始一个新项目 - 一个视频网站.用户可以通过点击"喜欢"或"不喜欢"或其他相关内容进行注册和投票.无论如何,它将是一个2选项投票系统,而不是一个五星系统.
每隔X天,我就会生成最受欢迎视频的"图表".所以我的问题是:我应该如何确定给定视频的受欢迎程度?
如果我按照大多数视图计算视频的路线,这可能会产生非常糟糕的视频效果,使其成为图表(仅仅因为它们非常糟糕).
如果我根据"喜欢"和"不喜欢"投票的数量(例如,100票赞成票,50票不等票等于2票)进入评分系统的路线,那么视图很少的视频可能出现在图表.
所以,我需要做的是两者的结合.当然,禁止垃圾观点和投票.
你们这个主题的想法是什么?
编辑:删除了以下标签:[ mysql ] [ postgresql ],为其他更具代表性的标签腾出空间; 预期实现中使用的SQL技术似乎并没有太多关于评级模型本身的考虑因素.
你似乎错过了那些喜欢和不喜欢电影的观点,即使在相对同质的"选民"群体的背景下也是客观的.想想" Chix Flix "一词或称为" NetFlix " 的成功故事如何说明这种主观性......
然而,如果你坚持实施你建议的模型,那么有几个隐藏变量和系统动态需要被确认,并且可能在评级公式中被考虑在内.
所有这些考虑因素都表明在实施此评级系统时要谨慎.它还暗示可能需要将有关整套电影的统计数据纳入个别电影的评级公式中.换句话说,不要仅仅根据自己的投票/观看次数对给定的电影进行评级,而且还要考虑移动接收的平均投票次数,电影页面获得的最大视图等等.事实上,一个迭代过程,首先对电影进行[大致]排名,然后通过使用类似评级的电影组的统计数据来重新计算排名可以提供更好的系统(假设公式是"公平的"并且以某种方式收敛)