Val*_*Val 2 r linegraph ggplot2 categorical-data
我对R和统计数据都很陌生.我试图在线图中绘制ggplot2中的2个分类变量(词性"pos",条件"trcond")和数字1(得分"totacc").
> df1<-df[, c("trcond", "subtitle", "pos", "totacc")]
> head(df1)
trcond subtitle pos totacc
7 L New Scene_16 lex 0.250
29 N New Scene_16 lex 0.500
8 L New Scene_25 lex 0.875
30 N New Scene_25 lex 0.666
9 L New Scene_29 lex 1.000
31 N New Scene_29 lex 0.833
Run Code Online (Sandbox Code Playgroud)
我用过这个ggplot2命令:
>ggplot(data=summdfo, aes(x=pos, y=totacc, group=trcond, colour=trcond))
+ geom_line() + geom_point()
Run Code Online (Sandbox Code Playgroud)
但它不起作用,图形在整个地方都有彩色(蓝色和红色)点,而不仅仅是连接它们的两条线.我想发布我得到的图表,因为我缺乏解释的话,但这是我的第一篇文章,我似乎无法上传图片.
我想得到一个标准的简单2线图,例如本页中的蓝色和红色图(其中y =总账单,x =时间(午餐,晚餐)按性别分组):http://www.cookbook -r.com/Graphs/Bar_and_line_graphs_%28ggplot2%29/
这可能与我的数据集有关吗?如果是这样,我在代码中做错了什么?
在这里,我尝试根据您数据中的有限样本创建数据框.
df1 <- data.frame(trcond=rep(c('L', 'N'), 3),
subtitle=rep('New Scene_29', 6), # Not in use, just a dummy
pos=c('lex', 'lex', 'lex', 'noLex', 'noLex', 'noLex'),
totacc=c(0.250, 0.5, 0.875, 0.666, 1.000, 0.833))
Run Code Online (Sandbox Code Playgroud)
因为在这个数据框中,trcond by pos不平衡,所以情节会像这样混乱:
ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+
geom_line() +
geom_point()
Run Code Online (Sandbox Code Playgroud)
但是,如果您应用将为每个条件计算均值的汇总函数,则会显示正确的图:
ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+
geom_line(stat='summary', fun.y='mean') +
geom_point(stat='summary', fun.y='mean')
Run Code Online (Sandbox Code Playgroud)
同样,这是试图找出数据中的内容.最好的是,您在这里使用dput(head(df1,50))提供数据样本,以便为您提供更好的答案.