DATA = data.frame("TRIMESTER" = c(1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3),
"STUDENT" = c(1,2,3,4,5,6,7,1,2,3,5,9,10,11,3,7,10,6,12,15,17,16,21))
WANT = data.frame("TRIMESTER" = c(1,2,3),
"NEW_ENROLL" = c(7,3,5),
"TOTAL_ENROLL" = c(7,10,15))
Run Code Online (Sandbox Code Playgroud)
我有“数据”,想要制作“想要”,它有三列,对于每个“学期”,您计算新“学生”的数量,然后对于“TOTAL_ENROLL”,您只需计算每个学期唯一“学生”的总数。
我的尝试只计算每个学期的数量。
library(dplyr)
DATA %>%
group_by(TRIMESTER) %>%
count()
Run Code Online (Sandbox Code Playgroud) 示例代码
library(ggplot2)
ggplot(mtcars, aes(mpg, cyl, color = vs)) + geom_line()
Run Code Online (Sandbox Code Playgroud)
如果可以像使用上面的图制作的本示例中那样将任意文本添加到 x 轴,然后我在上面写了“任意文字”
set.seed(0)
data=data.frame("V1"=sample(1:10,size=4,rep=T),
"V2"=sample(1:10,size=4,rep=T),
"V3"=sample(1:10,size=4,rep=T),
"V4"=sample(1:10,size=4,rep=T))
names = data.frame("vars"=c("V1", "V2", "V3", "V4"),
"labels"=c("whale","toast","cheese","cow"))
want=data.frame("whale"=sample(1:10,size=4,rep=T),
"toast"=sample(1:10,size=4,rep=T),
"cheese"=sample(1:10,size=4,rep=T),
"cow"=sample(1:10,size=4,rep=T))
Run Code Online (Sandbox Code Playgroud)
我有数据、“数据”和一个数据框“名称”,其中包含“数据”的列名称和变量标签。
我想创建新的数据“想要”,它将“数据”中的变量名称替换为“名称”中的变量标签,但请注意,实际值不同,因为我不知道如何确保相同的采样值!
我想知道,如何获得啤酒调色板的十六进制#?
https://learnr.wordpress.com/2009/04/15/ggplot2-qualitative-colour-palettes/
data1=data.frame("Group1" = sample(1:2,100,r=T),
"Group2" = sample(c('a','b'),100,r=T),
"V1" = sample(1:3, 100, r=T),
"V2" = sample(0:1, 100, r=T),
"V3" = sample(1:5, 100, r=T),
"V4" = sample(1:2, 100, r=T))
data2=data.frame("Group1"=c(1,1,2,2),
"Group2"=c('a','b','a','b'),
"Size"=c(9,7,6,10),
"V1"=c(NA),
"V2"=c(NA),
"V3"=c(NA),
"V4"=c(NA))
Run Code Online (Sandbox Code Playgroud)
我有包含我的数据的“data1”。然后我有'data2',它有'Group1'和'Group2'和'Size'。我想要的是将我的数据按('Group1' 和 'Group2')分组,并从 'data1' 中随机抽取大小为 'Size' 的样本来填充 data2 中的 V1-V4。
有希望的输出看起来像这样,但根据“data1”填充了 NA 值
library(dplyr);library(tidyr)
data3= data2 %>%
uncount(Size)
Run Code Online (Sandbox Code Playgroud) 样本数据
x=c("AG.av08_binloop_v6","TL.av1_binloopv2")
Run Code Online (Sandbox Code Playgroud)
示例尝试
y=gsub(".*_","",x)
Run Code Online (Sandbox Code Playgroud)
样品要求
WANT=c("binloop_v6","binloopv2")
Run Code Online (Sandbox Code Playgroud)
基本上我的目标是在第一个下划线值之后提取所有字符。
group=c(1,1,2,2,3,4,4,5,5,6)
Run Code Online (Sandbox Code Playgroud)
我希望生成一个如下所示的输出:
重复:4
点头:2
基本上我想计算有多少值是重复的“dup”并计算有多少不是“nodup”
data1=data.frame(Year=c(1,1,1,2,2,2,3,3,3),
"Group=c('A','A','A','B','B','B','C','C','C'),
"A=c(5,6,7,10,9,6,10,7,10),
"B=c(8,10,5,6,9,8,9,5,8),
"C=c(7,9,5,5,8,7,9,5,10))
data2=data.frame(Year=c(1,1,1,2,2,2,3,3,3),
"Group=c('A','A','A','B','B','B','C','C','C'),
"A=c(5,6,7,10,9,6,0,0,0),
"B=c(8,10,5,6,9,8,0,0,0),
"C=c(7,9,5,5,8,7,-99,-99,-99))
Run Code Online (Sandbox Code Playgroud)
我有'data1'并希望通过使用data.table中的fifelse来获得'data2'。规则是,如果 Group = 'C',则列 'A' 和 'B' 等于 0,列 'C' 等于 -99。
data=mtcars
data$group = rep(seq(from=1, to=4, by=1), 8)
model1 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 1), family = "binomial")
model2 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 2), family = "binomial")
model3 <- glm(vs ~ mpg + cyl + disp + hp, data = subset(data, group == 3), family = "binomial")
model4 <- glm(vs ~ mpg + cyl + disp + hp, data = …Run Code Online (Sandbox Code Playgroud) 我正在做 Latex 投影仪,无论我有多少张幻灯片,我都希望所有幻灯片都出现在 100 张中。
所以幻灯片 1 将是:1/100 幻灯片 2 将是:2/100 幻灯片 3 将是:3/100
我不知道要这样做吗?
r ×9
data.table ×2
dplyr ×2
ggplot2 ×2
beamer ×1
colorbrewer ×1
duplicates ×1
gsub ×1
latex ×1
performance ×1
rename ×1
sample ×1