为什么scipy.norm.pdf有时会给PDF> 1？怎么纠正呢？

Question

为什么scipy.norm.pdf有时会给PDF> 1？怎么纠正呢？

Ébe*_*aac 8 python distribution normal-distribution scipy

给定高斯(正态)随机变量的均值和方差,我想计算其概率密度函数(PDF).

但是当我绘制曲线的PDF时,概率超过1!请参阅此最低工作示例:

import numpy as np
import scipy.stats as stats

x = np.linspace(0.3, 1.75, 1000)
plt.plot(x, stats.norm.pdf(x, 1.075, 0.2))
plt.show()

Run Code Online (Sandbox Code Playgroud)

这就是我得到的:

怎么可能有200%的概率得到平均值,1.075？我在这里误解了什么吗？有没有办法纠正这个？

Answer 1

ayh*_*han 17

这不是一个错误.这也不是一个错误的结果.概率密度函数在某个特定点的值不会给出概率; 它衡量分布在该值附近的密度.对于连续随机变量,给定点的概率等于零.而不是p(X = x),我们计算2点之间的概率p(x1 < X < x2),它等于低于该概率密度函数的面积.概率密度函数的值很可能高于1.它甚至可以接近无穷大.

@ÉbeIsaac为答案添加一个点**整个区间的PDF的INTEGRAL**等于1.但PDF本身可能高于1,低于1,当然不能为负. (4认同)
总的来说，我认为大多数入门级（大学水平）的概率和统计教科书都没有讨论这些问题，而且如果不对真实的分析/度量/ Riemann-sum有所了解，就很难形成直觉。我发现这是一个轻松的介绍：http://www.statsathome.com/2017/06/26/measure-theory-made-ridiculously-simple/ (2认同)

归档时间：	9 年，7 月前
查看次数：	4113 次
最近记录：	9 年，7 月前