是否可以将RandomForests应用于非常小的数据集?我有一个包含许多变量的数据集,但每个只有25个观察值.随机森林产生合理的结果,低OOB误差(10-25%).关于使用的最小观测数量是否有任何经验法则?事实上,其中一个响应变量是不平衡的,如果我要对它进行二次采样,我最终会得到更少的观察结果.提前致谢
我需要将latlong中的地图投影到方位角等距投影.
map_proj<-projectRaster(map, crs="+proj=aeqd +lon_0=48+lat_0=18")
Run Code Online (Sandbox Code Playgroud)
在我的原始地图中,我有这些价值观
class : RasterLayer
dimensions : 1713, 2185, 3742905 (nrow, ncol, ncell)
resolution : 0.008335028, 0.00833354 (x, y)
extent : 39.06984, 57.28187, -25.93814, -11.66279 (xmin, xmax, ymin, ymax)
coord. ref. : +proj=longlat +datum=WGS84 +no_defs +ellps=WGS84 +towgs84=0,0,0
data source : /Users/Oritteropus/Desktop/Progetti/maps/mada_rast2
names : mada_rast2
values : 0, 255 (min, max)
unique(map)
[1] 0 1 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 24 25 26 27 28
[24] 29 …
Run Code Online (Sandbox Code Playgroud) 当有多个预测变量时,是否可以绘制混合模型的随机截距或斜率?
有了一个预测器,我会这样做:
#generate one response, two predictors and one factor (random effect)
resp<-runif(100,1, 100)
pred1<-c(resp[1:50]+rnorm(50, -10, 10),resp[1:50]+rnorm(50, 20, 5))
pred2<-resp+rnorm(100, -10, 10)
RF1<-gl(2, 50)
#gamm
library(mgcv)
mod<-gamm(resp ~ pred1, random=list(RF1=~1))
plot(pred1, resp, type="n")
for (i in ranef(mod$lme)[[1]]) {
abline(fixef(mod$lme)[1]+i, fixef(mod$lme)[2])
}
#lmer
library(lme4)
mod<-lmer(resp ~ pred1 + (1|RF1))
plot(pred1, resp, type="n")
for (i in ranef(mod)[[1]][,1]) {
abline(fixef(mod)[1]+i, fixef(mod)[2])
}
Run Code Online (Sandbox Code Playgroud)
但是,如果我有这样的模型呢?:
mod<-gamm(resp ~ pred1 + pred2, random=list(RF1=~1))
Run Code Online (Sandbox Code Playgroud)
或者与lmer
mod<-lmer(resp ~ pred1 + pred2 + (1|RF1))
Run Code Online (Sandbox Code Playgroud)
我应该考虑所有系数还是只考虑我正在绘制的变量?
谢谢
我有一个带有许多补丁的栅格地图(具有相同值的连续单元块)。我需要做的是获取每个补丁的中心(或靠近中心)的坐标。我对光栅包非常缺乏经验,但似乎只有我知道地图中单元格的位置才能获得坐标。有没有办法获得坐标,而不是给出单元格的值?谢谢