cla*_*aws 4 math statistics imdb weighted-average
我这样做只是出于学习目的.我没有打算扭转IMDB的方法.
我问自己我拥有IMDB或类似的网站.我该如何计算电影评级?
我能想到的只是加权平均值(这只是算术平均值)
对于下面提供的电影数据,计算将是
(38591*10 + 27994*9 + 32732*8 + 17864*7 + 7361*6 + 2965*5 + 1562*4 + 1073*3 + 891*2 + 3401*1)/ 134434 = 8.17055953

我的评级8.17055953与IMDB评级(=加权平均值)不符.所以我的结论是我在这里遗漏了一些东西,或者我的分数不是理想分数.我可能会遗漏很多东西.
首先:您的计算(这是一个未加权的平均值,或者只是平均值)有一个拼写错误:您有19562“4”评级,但您应该有1562。修正后得到 ~8.17,四舍五入到与 IMDB 的算术平均值相同。
接下来,如果您确实想要加权平均值,则需要一些东西来衡量!因此,如果用户拥有“声誉”或类似的声誉(即使只是注册的时间长度),您可以将其用作其评级权重的乘数。最后除以权重总和而不是总票数,就得到了加权平均值。
可能需要某种权重的比例因子 - 例如,如果 SO 做了这样的事情,那么 Jon Skeet 的意见承载新注册用户意见权重的二十万倍可能有点不公平:)