Python没有内置任何加权采样功能(NumPy/SciPy),但对于这样一个非常简单的情况,它非常简单:
import itertools
import random
probabilities = [0.3, 0.2, 0.5]
totals = list(itertools.accumulate(probabilities))
def sample():
n = random.uniform(0, totals[-1])
for i, total in enumerate(totals):
if n <= total:
return i
Run Code Online (Sandbox Code Playgroud)
如果你没有Python 3.2+,你就没有这个accumulate功能; 如果列表确实如此简短,你可以使用低效的单行代码伪造它:
totals = [sum(probabilities[:i+1]) for i in range(len(probabilities))]
Run Code Online (Sandbox Code Playgroud)
...或者您可以编写显式循环或丑陋的reduce调用,或从文档中复制等效的Python函数.
另外,请注意,如果您可以确定您的数字加起来为1.0 ,那么这random.uniform(0, totals[-1])只是一种更复杂的写作方式random.random().
一种快速测试方法:
>>> samples = [sample() for _ in range(100000)]
>>> samples.count(0)
29878
>>> samples.count(1)
19908
>>> samples.count(2)
50214
Run Code Online (Sandbox Code Playgroud)
这些分别非常接近100000的30%,20%和50%.