我已经建立了密度函数,现在我想计算一个新数据点"下降"到选定区间的概率(比如,a = 3,b = 7).所以,我正在寻找:
P(a<x<=b)
Run Code Online (Sandbox Code Playgroud)
一些样本数据:
df<- data.frame(x=c(sample(6:9, 50, replace=TRUE), sample(18:23, 25, replace=TRUE)))
dens<- density(df$x)
Run Code Online (Sandbox Code Playgroud)
我会很高兴听到任何解决方案,但最好是在基础r
先感谢您
当我在我的测试数据上运行随机森林模型时,我得到的是相同数据集+模型的不同结果.
以下是您可以看到第一列的差异的结果:
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 14 7
TRUE 13 66
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 15 7
TRUE 12 66
Run Code Online (Sandbox Code Playgroud)
虽然差异非常小,但我正在努力了解导致这种情况的原因.我猜这predict有"灵活"的分类门槛,虽然我在文档中找不到; 我对吗?
先感谢您
我正在下载我的数据,并且我得到以下代码的不同结果:
subset(df, x==1)
df[df$x==1,]
Run Code Online (Sandbox Code Playgroud)
x的类型是 integer
难道我做错了什么?先感谢您