我有如下数据,我需要确定数据的分布.请帮助.
x <- c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40)
Run Code Online (Sandbox Code Playgroud)
Kon*_*rad 23
一种简洁的方法将涉及使用 fitdistrplus提供分配拟合工具的包.关于您的数据示例.
library(fitdistrplus)
descdist(x, discrete = FALSE)
Run Code Online (Sandbox Code Playgroud)
现在您可以尝试适应不同的分布.例如:
normal_dist <- fitdist(x, "norm")
Run Code Online (Sandbox Code Playgroud)
abs随后检查合适:
plot(normal_dist)
Run Code Online (Sandbox Code Playgroud)
作为一般性观点,我建议您在Cross Validated中查看此讨论,其中主题将进行详细讨论.您可能也愿意看看的一篇论文Delignette -穆勒和Dutang - fitdistrplus的:R软件包拟合分布,可在这里如果你有兴趣在如何使用Cullen和Frey图更详细的解释.
首先,您可以做的是绘制直方图并叠加密度
hist(x, freq = FALSE)
lines(density(x))
Run Code Online (Sandbox Code Playgroud)
然后,您会看到分布是双峰的,它可以是两种分布或任何其他分布的混合。
一旦您确定了候选分布,“qqplot”可以帮助您直观地比较分位数。
| 归档时间: |
|
| 查看次数: |
18482 次 |
| 最近记录: |