我有一个数据框
a <- runif (10)
b <- letters [1:10]
c <- c(rep ("A-B", 4), rep("A_C", 6))
data1 <- data.frame (a, b, c)
data1
Run Code Online (Sandbox Code Playgroud)
我想_在列c的A_C中替换-以获得像data2这样的数据帧:
z <- c(rep ("A-B", 4), rep("A-C", 6))
data2 <- data.frame (a, b, z)
data2
Run Code Online (Sandbox Code Playgroud)
你知道我怎么做吗?
我想绘制一个直方图,其中 y 轴代表一列的总和。我找到了分类数据的这个例子: R histogram that sums 而不是 frequency。但是,这不是我要找的,因为它不适用于连续数据,我必须在其中定义垃圾箱。
假设我有 x 和 y:
set.seed(1)
mydata <- data.frame(y = runif (100, min= 0, max = 1),
x = rpois(100, 15) * 10)
Run Code Online (Sandbox Code Playgroud)
传统的直方图如下所示:
hist (mydata$x)
Run Code Online (Sandbox Code Playgroud)

现在如何获得 y 轴上 y 的累积总和?
我有成功/失败数据(在一段时间内幸存/死亡的树木),并且想要估计二项分布中的错误与我的每个观察结果(7个站点)相关联.到目前为止,我一直在使用glm这样做:
s <- c(1,20,0,40,2,1,0) # success
f <- c(2,0,20,4,50,0,1) # failure
#for each observation I would calculate this error:
error <- vector ()
z_scores <- vector ()
p_value <- vector ()
for (i in 1:7) {
models <- glm (cbind (s[i], f[i]) ~ 1, family = 'binomial')
error [i] <- summary (models)$coefficients[2]
z_scores [i] <- summary (models)$coefficients[3]
p_value [i] <- summary (models)$coefficients[4]
}
Run Code Online (Sandbox Code Playgroud)
这是最好的方法吗?
这里估算二项分布的概率如何?
注意:成功与失败,不论数量我的错误是非常高时,无论是s或f有=0
我想在不改变其他词的情况下替换某些术语.在这里,我想改变sp为indet不改变换句话说,如species.
names <- c ('sp', 'sprucei', 'sp', 'species')
我试过gsub但是当我运行它时输出不是我想要的
gsub (' sp', ' indet', names)
输出:
[1] "indet" "indetrucei" "indet" "indetecies"
并不是:
[1] "indet" "sptrucei" "indet" "sptecies"
有什么建议?干杯!