小编bvo*_*owe的帖子

按组计算唯一值

    DATA = data.frame("TRIMESTER" = c(1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3),
                      "STUDENT" = c(1,2,3,4,5,6,7,1,2,3,5,9,10,11,3,7,10,6,12,15,17,16,21))
    
    WANT = data.frame("TRIMESTER" = c(1,2,3),
                      "NEW_ENROLL" = c(7,3,5),
                      "TOTAL_ENROLL" = c(7,10,15))

Run Code Online (Sandbox Code Playgroud)

我有“数据”，想要制作“想要”，它有三列，对于每个“学期”，您计算新“学生”的数量，然后对于“TOTAL_ENROLL”，您只需计算每个学期唯一“学生”的总数。

我的尝试只计算每个学期的数量。

library(dplyr)
DATA %>%
group_by(TRIMESTER) %>%
count()

Run Code Online (Sandbox Code Playgroud)

r dplyr

bvo*_*owe

2022 08-15

8
推荐指数

2
解决办法

622
查看次数

在绘图区域外添加文本

示例代码

library(ggplot2)
ggplot(mtcars, aes(mpg, cyl, color = vs)) + geom_line()

Run Code Online (Sandbox Code Playgroud)

如果可以像使用上面的图制作的本示例中那样将任意文本添加到 x 轴，然后我在上面写了“任意文字”

r ggplot2

bvo*_*owe

2019 02-20

7
推荐指数

2
解决办法

1万
查看次数

根据向量重命名列

set.seed(0)
data=data.frame("V1"=sample(1:10,size=4,rep=T),
                "V2"=sample(1:10,size=4,rep=T),
                "V3"=sample(1:10,size=4,rep=T),
                "V4"=sample(1:10,size=4,rep=T))

names = data.frame("vars"=c("V1", "V2", "V3", "V4"),
                   "labels"=c("whale","toast","cheese","cow"))


want=data.frame("whale"=sample(1:10,size=4,rep=T),
                "toast"=sample(1:10,size=4,rep=T),
                "cheese"=sample(1:10,size=4,rep=T),
                "cow"=sample(1:10,size=4,rep=T))

Run Code Online (Sandbox Code Playgroud)

我有数据、“数据”和一个数据框“名称”，其中包含“数据”的列名称和变量标签。

我想创建新的数据“想要”，它将“数据”中的变量名称替换为“名称”中的变量标签，但请注意，实际值不同，因为我不知道如何确保相同的采样值！

r rename dplyr

bvo*_*owe

2020 02-09

5
推荐指数

3
解决办法

7496
查看次数

R Colors Brewer 获取 HEX

我想知道，如何获得啤酒调色板的十六进制#？

https://learnr.wordpress.com/2009/04/15/ggplot2-qualitative-colour-palettes/

r ggplot2 colorbrewer

bvo*_*owe

lucky-day

5
推荐指数

2
解决办法

2万
查看次数

来自不同数据框的样本

 data1=data.frame("Group1" = sample(1:2,100,r=T),
                  "Group2" = sample(c('a','b'),100,r=T),
                  "V1" = sample(1:3, 100, r=T),
                  "V2" = sample(0:1, 100, r=T),
                  "V3" = sample(1:5, 100, r=T),
                  "V4" = sample(1:2, 100, r=T))


data2=data.frame("Group1"=c(1,1,2,2),
                  "Group2"=c('a','b','a','b'),
                  "Size"=c(9,7,6,10),
                  "V1"=c(NA),
                  "V2"=c(NA),
                  "V3"=c(NA),
                  "V4"=c(NA))

Run Code Online (Sandbox Code Playgroud)

我有包含我的数据的“data1”。然后我有'data2'，它有'Group1'和'Group2'和'Size'。我想要的是将我的数据按（'Group1' 和 'Group2'）分组，并从 'data1' 中随机抽取大小为 'Size' 的样本来填充 data2 中的 V1-V4。

有希望的输出看起来像这样，但根据“data1”填充了 NA 值

library(dplyr);library(tidyr)
data3= data2 %>% 
  uncount(Size)

Run Code Online (Sandbox Code Playgroud)

r sample data.table

bvo*_*owe

2020 03-25

4
推荐指数

1
解决办法

78
查看次数

R 返回第一个下划线后的所有字符

样本数据

x=c("AG.av08_binloop_v6","TL.av1_binloopv2")

Run Code Online (Sandbox Code Playgroud)

示例尝试

y=gsub(".*_","",x)

Run Code Online (Sandbox Code Playgroud)

样品要求

WANT=c("binloop_v6","binloopv2")

Run Code Online (Sandbox Code Playgroud)

基本上我的目标是在第一个下划线值之后提取所有字符。

r gsub

bvo*_*owe

lucky-day

3
推荐指数

1
解决办法

4531
查看次数

在 R 中计算向量中的重复项

group=c(1,1,2,2,3,4,4,5,5,6)

Run Code Online (Sandbox Code Playgroud)

我希望生成一个如下所示的输出：

重复：4

点头：2

基本上我想计算有多少值是重复的“dup”并计算有多少不是“nodup”

r duplicates

bvo*_*owe

2020 06-20

2
推荐指数

1
解决办法

68
查看次数

R Data.Table 多重赋值 IfElse

data1=data.frame(Year=c(1,1,1,2,2,2,3,3,3),
"Group=c('A','A','A','B','B','B','C','C','C'),
"A=c(5,6,7,10,9,6,10,7,10),
"B=c(8,10,5,6,9,8,9,5,8),
"C=c(7,9,5,5,8,7,9,5,10))



data2=data.frame(Year=c(1,1,1,2,2,2,3,3,3),
"Group=c('A','A','A','B','B','B','C','C','C'),
"A=c(5,6,7,10,9,6,0,0,0),
"B=c(8,10,5,6,9,8,0,0,0),
"C=c(7,9,5,5,8,7,-99,-99,-99))

Run Code Online (Sandbox Code Playgroud)

我有'data1'并希望通过使用data.table中的fifelse来获得'data2'。规则是，如果 Group = 'C'，则列 'A' 和 'B' 等于 0，列 'C' 等于 -99。

r data.table

bvo*_*owe

lucky-day

2
推荐指数

1
解决办法

96
查看次数

R循环回归

data=mtcars
data$group = rep(seq(from=1, to=4, by=1), 8)


model1 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 1), family = "binomial")
model2 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 2), family = "binomial")
model3 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 3), family = "binomial")
model4 <- glm(vs ~ mpg + cyl + disp + hp, data = …

Run Code Online (Sandbox Code Playgroud)

performance r memory-efficient

bvo*_*owe

2019 10-02

1
推荐指数

1
解决办法

51
查看次数