4 python arrays statistics numpy distribution
Numpy是否有任何内置函数可以从1D numpy数组中随机选择值,并为数组末尾的值赋予更高的权重?有没有比定义偏斜分布和从中采样以获得数组索引更简单的方法?
你可以给一个重量np.choice,如图所示:
a = np.random.random(100) # an array to draw from
n = 10 # number of values to draw
i = np.arange(a.size) # an array of the index value for weighting
w = np.exp(i/10.) # higher weights for larger index values
w /= w.sum() # weight must be normalized
Run Code Online (Sandbox Code Playgroud)
现在,访问您的值:
np.random.choice(a, size=n, p=w)
Run Code Online (Sandbox Code Playgroud)
显然你可以根据需要改变你的重量阵列,我从衰减长度开始以指数衰减10; 为更广泛的选择增加衰减长度:
用于np.exp(i/50.):
In [38]: np.random.choice(a, size=n, p=w)
Out[38]: array([37, 53, 45, 22, 88, 69, 56, 86, 96, 24])
Run Code Online (Sandbox Code Playgroud)
用于np.exp(i):
In [41]: np.random.choice(a, size=n, p=w)
Out[41]: array([99, 99, 98, 99, 99, 99, 99, 97, 99, 98])
Run Code Online (Sandbox Code Playgroud)
如果您只希望能够获得每个值一次,请确保设置replace=False,否则您可以多次获得相同的值(特别是如果它是高度加权的,如上面的第二个示例中所示).看这个例子:
In [33]: np.random.choice(a, size=n, replace=False, p=w)
Out[33]: array([99, 84, 86, 91, 87, 81, 96, 89, 97, 95])
In [34]: np.random.choice(a, size=n, replace=True, p=w)
Out[34]: array([94, 98, 99, 98, 97, 99, 91, 96, 97, 93])
Run Code Online (Sandbox Code Playgroud)
我原来的答案是:
如果分布的形式并不重要,你可以做一些像指数的泊松分布:
idx = np.random.poisson(size=10)
Run Code Online (Sandbox Code Playgroud)
你的样本:
a[-idx-1]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1229 次 |
| 最近记录: |