我尝试找到此数据集的分布。我尝试过fitdistrplus包装
data <- data.matrix(Book1)
descdist(data, discrete = FALSE)
Run Code Online (Sandbox Code Playgroud)
但是得到这个错误:
descdist(data,离散= FALSE)中的错误:数据必须是数字向量
您可以改用
data <- as.numeric(Book1)
descdist(data, discrete = FALSE)
Run Code Online (Sandbox Code Playgroud)
这样可以得到此图:
这些值:
summary statistics
------
min: 3 max: 35
median: 5
mean: 6.244898
estimated sd: 3.517
estimated skewness: 1.977063
estimated kurtosis: 9.456783
Run Code Online (Sandbox Code Playgroud)
然后,如果您确定最接近的是指数分布,则可以像这样获得其参数
ft <- fitdist(data, distr = "exp" )
ft
Fitting of the distribution ' exp ' by maximum likelihood
Parameters:
estimate Std. Error
rate 0.1601307 0.002299016
Run Code Online (Sandbox Code Playgroud)
您可以使用以下功能比较它们的密度:
denscomp(ft)
Run Code Online (Sandbox Code Playgroud)