所以,我尝试模拟混合泊松分布:
data2 <- data.frame(x = c(rpois(n = 50, lambda = 0), rpois(n = 450, lambda = 10)))
Run Code Online (Sandbox Code Playgroud)
然后在其上绘制直方图和密度函数,对于分布函数,我使用spatstatdmixpois包中的函数。这是该图的代码:
ggplot(data2, aes(x = x)) +
geom_histogram(aes(y = ..density..), bins = 15) +
geom_line(aes(x = x, y = dmixpois(data2$x, mu = 9, sd = sqrt(41))))
Run Code Online (Sandbox Code Playgroud)
显然,密度函数是错误的。据我所知,混合泊松分布的均值是单个分布均值的线性组合,方差为 Elambda + Varlambda。在图中,我只使用了方差项,但如果添加 lambda 的期望值,密度会变得更加陡峭。计算有什么问题?