我现在非常困难,因为我试图弄清楚如何从glmR中的输出计算概率.我知道数据非常微不足道但我真的很想展示如何从输出中获得概率这个.我正在考虑尝试,inv.logit()但不知道括号内放置了哪些变量.
数据来自占用率研究.我正在评估一种头发陷阱方法与相机陷阱在检测3种(红松鼠,松貂和入侵灰松鼠)方面的成功.我想看看是什么影响了各种物种的检测(或非检测).一个假设是在现场检测到另一个焦点物种会影响红松鼠的可探测性.鉴于松貂是红松鼠的捕食者并且灰松鼠是竞争者,这两个物种在一个地点的存在可能会影响红松鼠的可探测性.
这会显示概率吗? inv.logit(-1.14 - 0.1322 * nonRS events)
glm(formula = RS_sticky ~ NonRSevents_before1stRS, family = binomial(link = "logit"), data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.7432 -0.7432 -0.7222 -0.3739 2.0361
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.1455 0.4677 -2.449 0.0143 *
NonRSevents_before1stRS -0.1322 0.1658 -0.797 0.4255
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1) …Run Code Online (Sandbox Code Playgroud) a <- c(1,2,3)
b <- c(1,2)
corr <- cor(a,b)
Run Code Online (Sandbox Code Playgroud)
我有两个时间序列变量,想要计算相关性,但它们有不同的样本量。为了简化我的问题,考虑是否有两个变量a,b并且我想计算 和 之间的相关性a,b但我只想计算前两个值。我如何在 R 中实现这一目标?
我正在使用一些代码并尝试将其从R转换为MATLAB.
我发现了一些使用的代码 rnorm(20)
我已经看到,在R和MATLAB的等同的功能是rnorm(1,mu,sigma)和normrnd(mu,sigma)分别.
我的问题是:rnorm(20)实际上在做什么以及如何在MATLAB中复制它?
我有一个数据集,其中包含参与者 IDS 和每个参与者的 17 种不同度量。
我需要删除离群值 - 与两侧均值相差 3 个标准差的数字。这需要对每一列单独进行。
到目前为止,通过使用下面的代码,我已经成功地将 NA 添加到每列的离群值列中,但这对我没有多大帮助,因为我需要能够将 NA 添加到带有其余数字的列中或者简单地删除异常值
理想情况下,我想要访问一个如下所示的文件:
ID measure1 measure2 ....measure17
1 10897 64436
2 184658 1739473
3 75758
4 746483 4327349 3612638
5 6444 36363 46447
Run Code Online (Sandbox Code Playgroud)
到目前为止我使用过的代码:
phenotypes <- colnames(imaging_data_kept[,2:ncol(imaging_data_kept)])
for (i in phenotypes){
Min <- mean(imaging_data_kept[[i]]) - (3*sd(imaging_data_kept[[i]]))
Max <- mean(imaging_data_kept[[i]]) + (3*sd(imaging_data_kept[[i]]))
imaging_data_kept[[paste0(i,"_outliers")]] <- imaging_data_kept[[i]] <
Min | imaging_data_kept[[i]] > Max
}
Run Code Online (Sandbox Code Playgroud)
样本数据:
SubjID M1 M2 M3 M4 M5
1000496 14898.1 9172 4902 5921.9 1428.2
1001121 5420.7 2855.5 …Run Code Online (Sandbox Code Playgroud) 我只是注意到我现在必须明确说明FALSE何时使用read.csv或设置printFlag为FALSEin等功能mice。这是对 RStudio 的更新还是只是一个错误?
样本:
read.csv(text="1,S0006,C000124,12Jan2017,179,7296
2,S0002,C000124,26Feb2017,109,7941
3,S0008,C000124,22Feb2017,190,4511
4,S0006,C000124,03Jan2017,150,7296
5,S0005,C000124,08Feb2017,120,5812
6,S0003,C000124,26Apr2017,46,7512",header=F)
Run Code Online (Sandbox Code Playgroud)
失败:
!header 中的错误:无效的参数类型,然后可以通过设置修复
header=FALSE
RStudio: $version
[1] ‘1.1.463’
R: 3.5.3RC
Run Code Online (Sandbox Code Playgroud) 我有一个矩阵
X1 X2 X3 X4 X5 X6 G1 G2
X1 5 0 0 0 0 0 5 0
X2 0 5 0 0 0 0 5 0
X3 0 0 5 0 0 0 5 0
X4 0 0 0 5 0 0 0 5
X5 0 0 0 0 5 0 0 5
X6 0 0 0 0 0 5 0 5
G1 5 5 5 0 0 0 15 0
G2 0 0 0 5 5 5 0 …Run Code Online (Sandbox Code Playgroud) 我想定义一个函数,当我输入一个字符串作为协变量时,该函数会将我的字符串放在特定位置并将其转换为公式。我知道我的代码不正确,但我不知道如何编写。
我想要的是,当我输入covars <- "+s(time,bs= 'cr',fx=TRUE,k=7)"该函数时,该函数将添加covars到这样的公式中gam.model <- gam(cvd ~ pm10 +s(time,bs= 'cr',fx=TRUE,k=7), data = chicagoNMMAPS , family =poisson, na.rm=T)
library(dlnm) # use chicagoNMMAPS data
library(mgcv)
# define myfun
myfun <- function(covars){
covars <- covars
gam.model <- gam(cvd ~ pm10 + covars, data = chicagoNMMAPS , family =poisson, na.rm=T)
summary(gam.model)
}
myfun("+s(time,bs= 'cr',fx=TRUE,k=7)")
Run Code Online (Sandbox Code Playgroud)
myfun 应该这样做:
gam.model <- gam(cvd ~ pm10 + covars, data = chicagoNMMAPS , family =poisson, na.rm=T)
Run Code Online (Sandbox Code Playgroud) 这是我的数据框(tibble)df:
ENSG00000000003 ENSG00000000005 ENSG00000000419 ENSG00000000457 ENSG00000000460
<dbl> <dbl> <dbl> <dbl> <dbl>
1 61 0 70 0 0
2 0 0 127 0 0
3 318 0 2 0 0
4 1 0 0 0 0
5 1 0 67 0 0
6 0 0 0 139 0
7 0 0 0 0 0
8 113 0 0 0 0
9 0 0 1 0 0
10 0 0 0 1 0
Run Code Online (Sandbox Code Playgroud)
对于每个列/变量,我想计算值大于 10 的行数。在这种情况下,第 1 列将是 3,第 2 …
我正在使用optim()(和optimize()) 尝试查找二项式分布的分位数,但是对于 N ~ 2000 (N = 2135),函数不会给出正确的值。
optim(21, function(x) abs(1 - pbinom(x, 2135, 21/2135) - 0.1),
method = "Brent", lower = 1, upper = 2135)
optimize(function(x) abs(1 - pbinom(x, 2135, 21/2135) - 0.1), c(1,2135))
Run Code Online (Sandbox Code Playgroud)
PS:我也尝试将min参数设置为等于概率,但我仍然得到错误的答案。
I have my data:
x <- list(10,50,100,250,500,2500)
y <- list(0.09090909,0.01960784,0.003984064,0.003984064,0.001996008,0.0003998401)
Run Code Online (Sandbox Code Playgroud)
I want to link my data to code found on this website
log_c <- seq(-12, 0, by = 0.1)
df <- data.frame(log_c = log_c, response = V(log_c, E, HS, log_EC50))
ggplot(df, aes(log_c, response)) +
geom_line()
Run Code Online (Sandbox Code Playgroud)

I want to put the x data in place of log_c and y data in place of response. These are my beginnings in R, so I am asking for help