有没有一种方便的方法来计算序列或单维numpy数组的百分位数?
我正在寻找类似于Excel的百分位函数的东西.
我查看了NumPy的统计参考,但是找不到这个.我能找到的只是中位数(第50百分位数),但不是更具体的东西.
我有一组数据,和一组用于创建垃圾箱的阈值:
data = np.array([0.01, 0.02, 1, 1, 1, 2, 2, 8, 8, 4.5, 6.6])
thresholds = np.array([0,5,10])
bins = np.digitize(data, thresholds, right=True)
Run Code Online (Sandbox Code Playgroud)
对于中的每个元素bins,我想知道基本百分位数。例如,在中bins,最小容器应从第0个百分点开始。然后是下一个垃圾箱,例如20%。因此,如果in中的值data落在0到20之间data,则它属于第一个bin。
我调查了熊猫,rank(pct=True)但似乎无法正确完成。
有什么建议吗?