为什么scipy.norm.pdf有时会给PDF> 1?怎么纠正呢?

Ébe*_*aac 8 python distribution normal-distribution scipy

给定高斯(正态)随机变量的均值和方差,我想计算其概率密度函数(PDF).

在此输入图像描述

我在这篇文章中提到:在Python中给出mean,std给出正态分布的概率,

另外scipy docs:scipy.stats.norm

但是当我绘制曲线的PDF时,概率超过1!请参阅此最低工作示例:

import numpy as np
import scipy.stats as stats

x = np.linspace(0.3, 1.75, 1000)
plt.plot(x, stats.norm.pdf(x, 1.075, 0.2))
plt.show()
Run Code Online (Sandbox Code Playgroud)

这就是我得到的:

高斯PDF曲线

怎么可能有200%的概率得到平均值,1.075?我在这里误解了什么吗?有没有办法纠正这个?

ayh*_*han 17

这不是一个错误.这也不是一个错误的结果.概率密度函数在某个特定点的值不会给出概率; 它衡量分布在该值附近的密度.对于连续随机变量,给定点的概率等于零.而不是p(X = x),我们计算2点之间的概率p(x1 < X < x2),它等于低于该概率密度函数的面积.概率密度函数的值很可能高于1.它甚至可以接近无穷大.

  • @ÉbeIsaac为答案添加一个点**整个区间的PDF的INTEGRAL**等于1.但PDF本身可能高于1,低于1,当然不能为负. (4认同)
  • 总的来说,我认为大多数入门级(大学水平)的概率和统计教科书都没有讨论这些问题,而且如果不对真实的分析/度量/ Riemann-sum有所了解,就很难形成直觉。我发现这是一个轻松的介绍:http://www.statsathome.com/2017/06/26/measure-theory-made-ridiculously-simple/ (2认同)