找到超过特定阈值的概率

use*_*847 1 python probability

我有一个长度为 324 的数组。我试图根据数组中的值找到超过特定阈值的概率

我努力了::

data = [3,4, 5, 1, 5, 8, 9] ## sample

p = 100 * (4/(len(data)+1)) ## where 4 is my threshold. 
Run Code Online (Sandbox Code Playgroud)

我不确定这是否正确,是否有更好的方法?

Ken*_*ama 5

如果您基于未知的数据分布,则可以计算超出阈值的元素与元素总数之间的比率。既然您已经标记了numpy,那么这里是一个使用它的解决方案。

import numpy as np

data = [3, 4, 5, 1, 5, 8, 9]
data = np.array(data)
threshold = 4
np.sum(data > threshold) / data.size
Run Code Online (Sandbox Code Playgroud)

输出

0.5714285714285714
Run Code Online (Sandbox Code Playgroud)