geom_area 绘图区域的间隙

Sum*_*edh 3 r ggplot2

我想根据因子变量“状态”区分绘图颜色的区域。我使用 fill=Status,但是,我看到绘图区域出现了中断。关于如何避免这种情况以及为什么会发生这种情况的任何想法/建议?

df1 <- data.frame(Date=seq(as.Date("2016/03/01"), as.Date("2016/03/10"), "day"),
             Storypoints=c(8,14,16,23,28,35,40,44,46,55),
             Status=c(rep("Completed",7), rep("Open",3)))

ggplot(data=df1, mapping = aes(x = Date)) + 
geom_area(aes(y=Storypoints, fill=Status))
Run Code Online (Sandbox Code Playgroud)

阴谋

Sti*_*ibu 5

原因是 Mar 07 和 Mar 08 之间没有数据点。而且由于间隙两侧的点不属于同一组,ggplot 不会将它们连接起来。简单地说,红色是在 3 月 7 日结束,蓝色是在 3 月 8 日开始,两者之间没有任何内容。

如果您对相同的绘图进行成像,但只是简单地去除了间隙,这意味着 x 轴应该同时标记为 Mar 07Mar 08,两条曲线接触的地方。

对此没有明显的解决方案,因为实际上没有可以在间隙中绘制的数据。如果您想填补空白,您必须做出决定并相应地修改您的数据。

一个可能的决定(但很可能不是一个很好的决定)是简单地添加一个数据点,以便读取区域填补空白:

df1[11, "Date"] <- as.Date("2016-03-08")
df1[11, "Storypoints"] <- 44
df1[11, "Status"] <- "Completed"
ggplot(data=df1, mapping = aes(x = Date)) + 
  geom_area(aes(y=Storypoints, fill=Status), pos = "identity")
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

但是这个问题很明显:我添加的数据点不应该存在,所以 3 月 8 日的情节实际上是误导性的。

我不确定是否有令人满意的解决方案。但也许其他人有更好的主意。

  • 这正是我写的。*没有*解决方案,因为差距是您的数据的属性。正如我所做的那样,每一种填补空白的方法都会引入一个“虚构的”数据点。我的回答的全部目的是展示这一点。 (3认同)