如何从加权列表中选择4个唯一项?

asl*_*lum 4 php random algorithm list weighted

所以我有一个加权项目列表,我想从这个列表中选择4个非重复项目.

Item     Weight
Apple     5
Banana    7
Cherry    12
...
Orange    8
Pineapple 50
Run Code Online (Sandbox Code Playgroud)

最有效的方法是什么?我最初的尝试是,如果一个已经被选中的项目出现的话,只需重新选择随后的选秀权......但是对于一个小名单,这可能会导致大量的重新加入.

编辑澄清:对于上面的例子,忽略水果D到N,总重量为82.因此首先被挑选的机会是:A~6%B~8.5%C~14.6%O~9.8%P ~61%一旦物品被挑选,概率将(应该!)改变.

Nic*_*ole 6

在你的评论中,你说这是独特的意思:

我不想两次选择同一个项目.

..并且权重决定了被挑选的可能性.

您需要做的就是确保不挑选重复项,只需从列表中删除最后一个选中的项目,然后再选择下一个项目.是的,这会稍微改变您的权重,但如果您确实需要独特的结果,那么这是正确的统计变化.


另外,我不确定你是如何使用权重来确定候选者的,但我想出了这个算法,它应该用最少的循环来完成这个(并且不需要根据权重填充数组,可能导致非常大的数组,需要int权重等)

我在这里使用了JavaScript,因此很容易在没有服务器的浏览器中看到输出.移植到PHP应该是微不足道的,因为它没有做任何复杂的事情.

常量

var FRUITS = [
    {name : "Apple", weight: 8 },
    {name : "Orange", weight: 4 },
    {name : "Banana", weight: 4 },
    {name : "Nectarine", weight: 3 },
    {name : "Kiwi", weight: 1 }
];

var PICKS = 3;

function getNewFruitsAvailable(fruits, removeFruit) {
    var newFruits = [];
    for (var idx in fruits) {
        if (fruits[idx].name != removeFruit) {
            newFruits.push(fruits[idx]);
        }
    }
    return newFruits;
}
Run Code Online (Sandbox Code Playgroud)

脚本

var results = [];
var candidateFruits = FRUITS;

for (var i=0; i < PICKS; i++) {
    // CALCULATE TOTAL WEIGHT OF AVAILABLE FRUITS
    var totalweight = 0;
    for (var idx in candidateFruits) {
        totalweight += candidateFruits[idx].weight;
    }
    console.log("Total weight: " + totalweight);

    var rand = Math.random();

    console.log("Random: " + rand);

    // ITERATE THROUGH FRUITS AND PICK THE ONE THAT MATCHES THE RANDOM
    var weightinc = 0;
    for (idx in candidateFruits) {
        // INCREMENT THE WEIGHT BY THE NEXT FRUIT'S WEIGHT
        var candidate = candidateFruits[idx];
        weightinc += candidate.weight;

        // IF rand IS BETWEEN LAST WEIGHT AND NEXT WEIGHT, PICK THIS FRUIT
        if (rand < weightinc/totalweight) {
            results.push(candidate.name);
            console.log("Pick: " + candidate.name);

            // GET NEXT SET OF FRUITS (REMOVING PICKED FRUIT)
            candidateFruits = getNewFruitsAvailable(candidateFruits, candidate.name);
            break;
        }
    }
    console.log("CandidateFruits: " + candidateFruits.length);
};
Run Code Online (Sandbox Code Playgroud)

产量

for (var i=0; i < results.length; i++) {
    document.write(results[i] + "<br/>");
}
Run Code Online (Sandbox Code Playgroud)

基本策略是将每个水果分配到总范围的一部分[0,1).在第一个循环中,你有这个:

  • Apple - 8/20 = 0.0最高0.4
  • 橙色 - 4/20 = 0.4至0.6
  • 香蕉 - 4/20 = 0.6至0.8
  • 油桃 - 3/20 = 0.8至0.95
  • 猕猴桃 - 8/20 = 0.95至1.0

该脚本遍历列表中的每个项目,并进行权重计数器.当它到达包含第一个随机的范围时,它会选择该项目,将其从列表中删除,然后根据新的总重量重新计算范围并再次运行.