小编Ben*_*ker的帖子

如何从GLM输出中获得概率

我现在非常困难,因为我试图弄清楚如何从glmR中的输出计算概率.我知道数据非常微不足道但我真的很想展示如何从输出中获得概率这个.我正在考虑尝试,inv.logit()但不知道括号内放置了哪些变量.

数据来自占用率研究.我正在评估一种头发陷阱方法与相机陷阱在检测3种(红松鼠,松貂和入侵灰松鼠)方面的成功.我想看看是什么影响了各种物种的检测(或非检测).一个假设是在现场检测到另一个焦点物种会影响红松鼠的可探测性.鉴于松貂是红松鼠的捕食者并且灰松鼠是竞争者,这两个物种在一个地点的存在可能会影响红松鼠的可探测性.

这会显示概率吗？ inv.logit(-1.14 - 0.1322 * nonRS events)

 glm(formula = RS_sticky ~ NonRSevents_before1stRS, family = binomial(link = "logit"), data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-0.7432  -0.7432  -0.7222  -0.3739   2.0361  
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
(Intercept)              -1.1455     0.4677  -2.449   0.0143 *
NonRSevents_before1stRS  -0.1322     0.1658  -0.797   0.4255  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
   (Dispersion parameter for binomial family taken to be 1) …

Run Code Online (Sandbox Code Playgroud)

r probability glm

Cri*_*ris

2018 01-07

1
推荐指数

2
解决办法

4689
查看次数

如何计算不同样本量的两个变量之间的相关性

a <- c(1,2,3)
b <- c(1,2)
corr <- cor(a,b)

Run Code Online (Sandbox Code Playgroud)

我有两个时间序列变量，想要计算相关性，但它们有不同的样本量。为了简化我的问题，考虑是否有两个变量a，b并且我想计算和之间的相关性a，b但我只想计算前两个值。我如何在 R 中实现这一目标？

r correlation

Lin*_*ang

2018 10-28

1
推荐指数

1
解决办法

2862
查看次数

rnorm(1,mu,sigma),在R到MATLAB中

我正在使用一些代码并尝试将其从R转换为MATLAB.

我发现了一些使用的代码 rnorm(20)

我已经看到,在R和MATLAB的等同的功能是rnorm(1,mu,sigma)和normrnd(mu,sigma)分别.

我的问题是:rnorm(20)实际上在做什么以及如何在MATLAB中复制它？

matlab r

S30*_*609

2018 12-19

1
推荐指数

1
解决办法

176
查看次数

如何删除数据框每列中的异常值（与平均值相差 3 个标准差）

我有一个数据集，其中包含参与者 IDS 和每个参与者的 17 种不同度量。

我需要删除离群值 - 与两侧均值相差 3 个标准差的数字。这需要对每一列单独进行。

到目前为止，通过使用下面的代码，我已经成功地将 NA 添加到每列的离群值列中，但这对我没有多大帮助，因为我需要能够将 NA 添加到带有其余数字的列中或者简单地删除异常值

理想情况下，我想要访问一个如下所示的文件：

ID measure1 measure2 ....measure17
1  10897                  64436
2  184658    1739473
3            75758
4  746483    4327349      3612638
5  6444      36363        46447

Run Code Online (Sandbox Code Playgroud)

到目前为止我使用过的代码：

phenotypes <- colnames(imaging_data_kept[,2:ncol(imaging_data_kept)])

 for (i in phenotypes){
  Min <- mean(imaging_data_kept[[i]]) - (3*sd(imaging_data_kept[[i]]))
  Max <- mean(imaging_data_kept[[i]]) + (3*sd(imaging_data_kept[[i]]))  
  imaging_data_kept[[paste0(i,"_outliers")]] <- imaging_data_kept[[i]] < 
  Min | imaging_data_kept[[i]] > Max
 }

Run Code Online (Sandbox Code Playgroud)

样本数据：

SubjID M1 M2 M3 M4 M5 
1000496 14898.1 9172 4902 5921.9 1428.2 
1001121 5420.7 2855.5 …

Run Code Online (Sandbox Code Playgroud)

作者

2019 03-28

1
推荐指数

1
解决办法

4290
查看次数

对 FALSE 使用 F 有时会失败

我只是注意到我现在必须明确说明FALSE何时使用read.csv或设置printFlag为FALSEin等功能mice。这是对 RStudio 的更新还是只是一个错误？

样本：

read.csv(text="1,S0006,C000124,12Jan2017,179,7296
2,S0002,C000124,26Feb2017,109,7941
         3,S0008,C000124,22Feb2017,190,4511
         4,S0006,C000124,03Jan2017,150,7296
         5,S0005,C000124,08Feb2017,120,5812
         6,S0003,C000124,26Apr2017,46,7512",header=F)

Run Code Online (Sandbox Code Playgroud)

失败：

!header 中的错误：无效的参数类型，然后可以通过设置修复 header=FALSE

RStudio: $version
[1] ‘1.1.463’
R: 3.5.3RC

Run Code Online (Sandbox Code Playgroud)

Nel*_*Gon

2019 04-10

1
推荐指数

1
解决办法

133
查看次数

如何反转一个完整的矩阵？

我有一个矩阵

            X1         X2        X3        X4        X5        X6           G1            G2
X1            5         0         0         0         0         0            5            0 
X2            0         5         0         0         0         0            5            0
X3            0         0         5         0         0         0            5            0
X4            0         0         0         5         0         0            0            5
X5            0         0         0         0         5         0            0            5  
X6            0         0         0         0         0         5            0            5  
G1            5         5         5         0         0         0           15            0  
G2            0         0         0         5         5         5            0 …

Run Code Online (Sandbox Code Playgroud)

Kat*_*man

2020 02-14

1
推荐指数

1
解决办法

78
查看次数

添加字符串作为具有定义函数的公式

我想定义一个函数，当我输入一个字符串作为协变量时，该函数会将我的字符串放在特定位置并将其转换为公式。我知道我的代码不正确，但我不知道如何编写。

我想要的是，当我输入covars <- "+s(time,bs= 'cr',fx=TRUE,k=7)"该函数时，该函数将添加covars到这样的公式中gam.model <- gam(cvd ~ pm10 +s(time,bs= 'cr',fx=TRUE,k=7), data = chicagoNMMAPS , family =poisson, na.rm=T)

library(dlnm) # use chicagoNMMAPS data
library(mgcv)
# define myfun
myfun <- function(covars){
  covars <- covars
  gam.model <- gam(cvd ~ pm10 + covars, data = chicagoNMMAPS , family =poisson, na.rm=T)
  summary(gam.model)

}

myfun("+s(time,bs= 'cr',fx=TRUE,k=7)")

Run Code Online (Sandbox Code Playgroud)

myfun 应该这样做：

gam.model <- gam(cvd ~ pm10 + covars, data = chicagoNMMAPS , family =poisson, na.rm=T)

Run Code Online (Sandbox Code Playgroud)

r formula mgcv

zhi*_* li

2020 02-22

1
推荐指数

1
解决办法

566
查看次数

使用 dplyr 计算每个变量出现的次数

这是我的数据框（tibble）df：

   ENSG00000000003 ENSG00000000005 ENSG00000000419 ENSG00000000457 ENSG00000000460
             <dbl>           <dbl>           <dbl>           <dbl>           <dbl>
 1              61               0              70               0               0
 2               0               0             127               0               0
 3             318               0               2               0               0
 4               1               0               0               0               0
 5               1               0              67               0               0
 6               0               0               0             139               0
 7               0               0               0               0               0
 8             113               0               0               0               0
 9               0               0               1               0               0
10               0               0               0               1               0

Run Code Online (Sandbox Code Playgroud)

对于每个列/变量，我想计算值大于 10 的行数。在这种情况下，第 1 列将是 3，第 2 …

r count dataframe dplyr

iTo*_*ill

2020 11-18

1
推荐指数

1
解决办法

47
查看次数

optim (method=Brent) 和 optimization 没有给出正确的二项式分布最小值 (N > 1000)

我正在使用optim()(和optimize()) 尝试查找二项式分布的分位数，但是对于 N ~ 2000 (N = 2135)，函数不会给出正确的值。

optim(21, function(x) abs(1 - pbinom(x, 2135, 21/2135) - 0.1), 
      method = "Brent", lower = 1, upper = 2135) 

optimize(function(x) abs(1 - pbinom(x, 2135, 21/2135) - 0.1), c(1,2135))

Run Code Online (Sandbox Code Playgroud)

PS：我也尝试将min参数设置为等于概率，但我仍然得到错误的答案。

use*_*rLx

2021 10-16

1
推荐指数

1
解决办法

481
查看次数

R plot x and y axes changes

I have my data:

x <- list(10,50,100,250,500,2500)
y <- list(0.09090909,0.01960784,0.003984064,0.003984064,0.001996008,0.0003998401)

Run Code Online (Sandbox Code Playgroud)

I want to link my data to code found on this website

log_c <- seq(-12, 0, by = 0.1)
df <- data.frame(log_c = log_c, response = V(log_c, E, HS, log_EC50))

ggplot(df, aes(log_c, response)) + 
  geom_line()

Run Code Online (Sandbox Code Playgroud)

在此输入图像描述