小编bvo*_*owe的帖子

按组计算唯一值

    DATA = data.frame("TRIMESTER" = c(1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3),
                      "STUDENT" = c(1,2,3,4,5,6,7,1,2,3,5,9,10,11,3,7,10,6,12,15,17,16,21))
    
    WANT = data.frame("TRIMESTER" = c(1,2,3),
                      "NEW_ENROLL" = c(7,3,5),
                      "TOTAL_ENROLL" = c(7,10,15))
Run Code Online (Sandbox Code Playgroud)

我有“数据”,想要制作“想要”,它有三列,对于每个“学期”,您计算新“学生”的数量,然后对于“TOTAL_ENROLL”,您只需计算每个学期唯一“学生”的总数。

我的尝试只计算每个学期的数量。

library(dplyr)
DATA %>%
group_by(TRIMESTER) %>%
count()
Run Code Online (Sandbox Code Playgroud)

r dplyr

8
推荐指数
2
解决办法
622
查看次数

在绘图区域外添加文本

示例代码

library(ggplot2)
ggplot(mtcars, aes(mpg, cyl, color = vs)) + geom_line()
Run Code Online (Sandbox Code Playgroud)

如果可以像使用上面的图制作的本示例中那样将任意文本添加到 x 轴,然后我在上面写了“任意文字”

在此处输入图片说明

r ggplot2

7
推荐指数
2
解决办法
1万
查看次数

根据向量重命名列

set.seed(0)
data=data.frame("V1"=sample(1:10,size=4,rep=T),
                "V2"=sample(1:10,size=4,rep=T),
                "V3"=sample(1:10,size=4,rep=T),
                "V4"=sample(1:10,size=4,rep=T))

names = data.frame("vars"=c("V1", "V2", "V3", "V4"),
                   "labels"=c("whale","toast","cheese","cow"))


want=data.frame("whale"=sample(1:10,size=4,rep=T),
                "toast"=sample(1:10,size=4,rep=T),
                "cheese"=sample(1:10,size=4,rep=T),
                "cow"=sample(1:10,size=4,rep=T))
Run Code Online (Sandbox Code Playgroud)

我有数据、“数据”和一个数据框“名称”,其中包含“数据”的列名称和变量标签。

我想创建新的数据“想要”,它将“数据”中的变量名称替换为“名称”中的变量标签,但请注意,实际值不同,因为我不知道如何确保相同的采样值!

r rename dplyr

5
推荐指数
3
解决办法
7496
查看次数

5
推荐指数
2
解决办法
2万
查看次数

来自不同数据框的样本

 data1=data.frame("Group1" = sample(1:2,100,r=T),
                  "Group2" = sample(c('a','b'),100,r=T),
                  "V1" = sample(1:3, 100, r=T),
                  "V2" = sample(0:1, 100, r=T),
                  "V3" = sample(1:5, 100, r=T),
                  "V4" = sample(1:2, 100, r=T))


data2=data.frame("Group1"=c(1,1,2,2),
                  "Group2"=c('a','b','a','b'),
                  "Size"=c(9,7,6,10),
                  "V1"=c(NA),
                  "V2"=c(NA),
                  "V3"=c(NA),
                  "V4"=c(NA))
Run Code Online (Sandbox Code Playgroud)

我有包含我的数据的“data1”。然后我有'data2',它有'Group1'和'Group2'和'Size'。我想要的是将我的数据按('Group1' 和 'Group2')分组,并从 'data1' 中随机抽取大小为 'Size' 的样本来填充 data2 中的 V1-V4。


有希望的输出看起来像这样,但根据“data1”填充了 NA 值

library(dplyr);library(tidyr)
data3= data2 %>% 
  uncount(Size)
Run Code Online (Sandbox Code Playgroud)

r sample data.table

4
推荐指数
1
解决办法
78
查看次数

R 返回第一个下划线后的所有字符

样本数据

x=c("AG.av08_binloop_v6","TL.av1_binloopv2")
Run Code Online (Sandbox Code Playgroud)

示例尝试

y=gsub(".*_","",x)
Run Code Online (Sandbox Code Playgroud)

样品要求

WANT=c("binloop_v6","binloopv2")
Run Code Online (Sandbox Code Playgroud)

基本上我的目标是在第一个下划线值之后提取所有字符。

r gsub

3
推荐指数
1
解决办法
4531
查看次数

在 R 中计算向量中的重复项

group=c(1,1,2,2,3,4,4,5,5,6)
Run Code Online (Sandbox Code Playgroud)

我希望生成一个如下所示的输出:

重复:4

点头:2

基本上我想计算有多少值是重复的“dup”并计算有多少不是“nodup”

r duplicates

2
推荐指数
1
解决办法
68
查看次数

R Data.Table 多重赋值 IfElse

data1=data.frame(Year=c(1,1,1,2,2,2,3,3,3),
"Group=c('A','A','A','B','B','B','C','C','C'),
"A=c(5,6,7,10,9,6,10,7,10),
"B=c(8,10,5,6,9,8,9,5,8),
"C=c(7,9,5,5,8,7,9,5,10))



data2=data.frame(Year=c(1,1,1,2,2,2,3,3,3),
"Group=c('A','A','A','B','B','B','C','C','C'),
"A=c(5,6,7,10,9,6,0,0,0),
"B=c(8,10,5,6,9,8,0,0,0),
"C=c(7,9,5,5,8,7,-99,-99,-99))
Run Code Online (Sandbox Code Playgroud)

我有'data1'并希望通过使用data.table中的fifelse来获得'data2'。规则是,如果 Group = 'C',则列 'A' 和 'B' 等于 0,列 'C' 等于 -99。

r data.table

2
推荐指数
1
解决办法
96
查看次数

R循环回归

data=mtcars
data$group = rep(seq(from=1, to=4, by=1), 8)


model1 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 1), family = "binomial")
model2 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 2), family = "binomial")
model3 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 3), family = "binomial")
model4 <- glm(vs ~ mpg + cyl + disp + hp, data = …
Run Code Online (Sandbox Code Playgroud)

performance r memory-efficient

1
推荐指数
1
解决办法
51
查看次数

Latex Beamer 自定义“超出”幻灯片编号

我正在做 Latex 投影仪,无论我有多少张幻灯片,我都希望所有幻灯片都出现在 100 张中。

所以幻灯片 1 将是:1/100 幻灯片 2 将是:2/100 幻灯片 3 将是:3/100

我不知道要这样做吗?

latex beamer

-3
推荐指数
1
解决办法
3226
查看次数