排序项的算法

Question

排序项的算法

Krz*_*iak 10 algorithm statistics ranking

我有一个6500项目的清单,我想交易或投资.(不是真钱,而是某个游戏.)每个项目有5个数字,将用于排名其他.

每日交易的商品总数:这个数字越高越好.

过去5天内该项目的Donchian频道:此数字越高越好.

价格的中位数差价:这个数字越低越好.

该项目的20天移动平均值的差价:该数字越低越好.

该项目的5天移动平均值的差价:该数字越高越好.

所有5个数字都具有相同的"权重",换句话说,它们都应该影响具有相同价值或价值的最终数字.

目前,我只是将每个项目的所有5个数字相乘,但它没有按照我们排名的方式对项目进行排名.我只是想将所有5个数字组合成一个加权数字,我可以使用它来对所有6500个项目进行排名,但我不确定如何正确或数学地执行此操作.

注意:每天交易的项目和donchian渠道的总数量远远高于差价,而更多的是百分比类型数字.这可能是为什么将它们全部放在一起对我不起作用的原因; 每天交易的数量和donchian渠道在最终数量中发挥了更大的作用.

Answer 1

Nic*_*cue 14

人们在回答这个问题时遇到问题的原因是我们没有办法比较两个不同的"属性".如果只有两个属性,比如数量交易和中位数价差,那么(2000万,50%)会更差还是更好(100,1%)？只有你可以决定这一点.

将所有内容转换为相同大小的数字可能有所帮助,这就是所谓的"规范化".这样做的一个好方法是普拉萨德提到的z分数.这是一个统计概念,着眼于数量的变化.您需要对数字的统计分布做一些假设才能使用它.

传播之类的东西可能是正常分布的 - 形状像正态分布.对于这些,正如普拉萨德所说的那样z(spread) = (spread-mean(spreads))/standardDeviation(spreads).

交易数量之类的东西可能是幂律分布.对于这些你可能想要log()在计算均值和sd之前采取.那是z得分z(qty) = (log(qty)-mean(log(quantities)))/sd(log(quantities)).

然后只需为每个属性添加z分数.

要为每个属性执行此操作,您需要了解其分布.你可以猜测,但最好的方法是绘制图表并看一看.您可能还想在对数刻度上绘制图表.请参阅维基百科以获取很长的列表.

Answer 2

Pra*_*ani 5

可以取代每个属性向量x(长度N = 6500由)z得分矢量Z(x),其中

Z(x) = (x - mean(x))/sd(x).

Run Code Online (Sandbox Code Playgroud)

这会将它们转换为相同的"比例",然后您可以将Z得分(具有相同的权重)相加以获得最终得分,并按N=6500该总得分对项目进行排名.如果你能在你的问题中找到一些其他的属性向量,它可以作为"善"的指标(比如安全性的10天回报？),那么你可以根据这些z得分拟合这个预测属性的回归模型变量,以找出最佳的非均匀权重.

归档时间：	15 年，4 月前
查看次数：	26757 次
最近记录：	7 年，4 月前