如何计算python中正常累积分布函数的倒数?

Yue*_*oum 55 python normal-distribution scipy

如何计算Python中正态分布的累积分布函数(CDF)的倒数?

我应该使用哪个库?可能是scipy?

War*_*ser 101

NORMSINV(在评论中提到)是标准正态分布的CDF的倒数.使用scipy,您可以使用对象的ppf方法计算它scipy.stats.norm.首字母缩略词ppf代表百分点函数,它是分位数函数的另一个名称.

In [20]: from scipy.stats import norm

In [21]: norm.ppf(0.95)
Out[21]: 1.6448536269514722
Run Code Online (Sandbox Code Playgroud)

检查它是否与CDF相反:

In [34]: norm.cdf(norm.ppf(0.95))
Out[34]: 0.94999999999999996
Run Code Online (Sandbox Code Playgroud)

默认情况下,norm.ppf使用mean = 0和stddev = 1,这是"标准"正态分布.您可以分别通过指定locscale参数来使用不同的均值和标准差.

In [35]: norm.ppf(0.95, loc=10, scale=2)
Out[35]: 13.289707253902945
Run Code Online (Sandbox Code Playgroud)

如果您查看源代码scipy.stats.norm,您会发现该ppf方法最终会调用scipy.special.ndtri.因此,要计算标准正态分布的CDF的倒数,您可以直接使用该函数:

In [43]: from scipy.special import ndtri

In [44]: ndtri(0.95)
Out[44]: 1.6448536269514722
Run Code Online (Sandbox Code Playgroud)

  • 我一直认为"百分点功能"(ppf)是一个可怕的名字.统计中的大多数人只使用"分位数函数". (16认同)

Xav*_*hot 18

开始Python 3.8,标准库提供NormalDist对象作为statistics模块的一部分。

它可用于获得逆累积分布函数inv_cdf- 的倒数cdf),也称为分位数函数或给定均值( ) 和标准差( )的百分比函数musigma

from statistics import NormalDist

NormalDist(mu=10, sigma=2).inv_cdf(0.95)
# 13.289707253902943
Run Code Online (Sandbox Code Playgroud)

对于标准正态分布(mu = 0sigma = 1)可以简化:

NormalDist().inv_cdf(0.95)
# 1.6448536269514715
Run Code Online (Sandbox Code Playgroud)

  • 很棒的提示!这使我能够放弃对 scipy 的依赖,而我只需要单个 stats.norm.ppf 方法 (4认同)

o0o*_*o0o 10

# given random variable X (house price) with population muy = 60, sigma = 40
import scipy as sc
import scipy.stats as sct
sc.version.full_version # 0.15.1

#a. Find P(X<50)
sct.norm.cdf(x=50,loc=60,scale=40) # 0.4012936743170763

#b. Find P(X>=50)
sct.norm.sf(x=50,loc=60,scale=40) # 0.5987063256829237

#c. Find P(60<=X<=80)
sct.norm.cdf(x=80,loc=60,scale=40) - sct.norm.cdf(x=60,loc=60,scale=40)

#d. how much top most 5% expensive house cost at least? or find x where P(X>=x) = 0.05
sct.norm.isf(q=0.05,loc=60,scale=40)

#e. how much top most 5% cheapest house cost at least? or find x where P(X<=x) = 0.05
sct.norm.ppf(q=0.05,loc=60,scale=40)
Run Code Online (Sandbox Code Playgroud)

  • PS:您可以将'loc'视为'mean',将'scale'视为'标准偏差' (4认同)