具有2个分类变量且在R中连续1个的折线图

Val*_*Val 2 r linegraph ggplot2 categorical-data

我对R和统计数据都很陌生.我试图在线图中绘制ggplot2中的2个分类变量(词性"pos",条件"trcond")和数字1(得分"totacc").

> df1<-df[, c("trcond", "subtitle", "pos", "totacc")]
> head(df1)
   trcond     subtitle pos totacc
7       L New Scene_16 lex  0.250
29      N New Scene_16 lex  0.500
8       L New Scene_25 lex  0.875
30      N New Scene_25 lex  0.666
9       L New Scene_29 lex  1.000
31      N New Scene_29 lex  0.833
Run Code Online (Sandbox Code Playgroud)

我用过这个ggplot2命令:

>ggplot(data=summdfo, aes(x=pos, y=totacc, group=trcond, colour=trcond))
+ geom_line() + geom_point()
Run Code Online (Sandbox Code Playgroud)

但它不起作用,图形在整个地方都有彩色(蓝色和红色)点,而不仅仅是连接它们的两条线.我想发布我得到的图表,因为我缺乏解释的话,但这是我的第一篇文章,我似乎无法上传图片.

我想得到一个标准的简单2线图,例如本页中的蓝色和红色图(其中y =总账单,x =时间(午餐,晚餐)按性别分组):http://www.cookbook -r.com/Graphs/Bar_and_line_graphs_%28ggplot2%29/

这可能与我的数据集有关吗?如果是这样,我在代码中做错了什么?

arm*_*man 5

在这里,我尝试根据您数据中的有限样本创建数据框.

df1 <- data.frame(trcond=rep(c('L', 'N'), 3), 
                  subtitle=rep('New Scene_29', 6),  # Not in use, just a dummy
                  pos=c('lex', 'lex', 'lex', 'noLex', 'noLex', 'noLex'), 
                  totacc=c(0.250, 0.5, 0.875, 0.666, 1.000, 0.833))
Run Code Online (Sandbox Code Playgroud)

因为在这个数据框中,trcond by pos不平衡,所以情节会像这样混乱:

ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+ 
  geom_line() + 
  geom_point()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述 但是,如果您应用将为每个条件计算均值的汇总函数,则会显示正确的图:

ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+ 
  geom_line(stat='summary', fun.y='mean') + 
  geom_point(stat='summary', fun.y='mean')
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述 同样,这是试图找出数据中的内容.最好的是,您在这里使用dput(head(df1,50))提供数据样本,以便为您提供更好的答案.