如何根据"争议"对故事进行排名?

use*_*015 4 algorithm

我想根据"争议"商来对我的故事进行排名.例如,reddit.com目前有"有争议的"部分:http://www.reddit.com/controversial/

当一个故事有很多上升和很多下来的投票时,即使总分为0(例如),它仍然存在争议.我应该如何计算这个商数分数,以便当有很多人投票时,我可以以某种方式捕捉到这一点.

谢谢!!!

缺口

Aln*_*tak 7

我建议使用投票的标准差.

一个有争议的投票,100%两极化将有相同的-1和+1票数,所以平均值为0,stddev约为1.0

相反,一组完全一致的投票(在相反方向没有投票)的平均值为1或-1,stddev为0.0.

不完全一致或完全极化的投票将产生0到约1.0之间的标准偏差数字,其中该值将表明投票中的争议程度.

  • 对于只能为-1或1的值的标准偏差不是一个好主意,因为它的比例不变(仅考虑比例).具有250个upvotes和100个downvotes的帖子将具有与具有25个upvotes和10个downvotes的帖子相同的标准偏差. (4认同)