ggplot2:将不连续的持续时间绘制为条形图

Kap*_*ppa 5 r ggplot2

我正在使用 ggplot 将各种事件绘制为它们开始的日期(x 轴)和开始时间(y 轴)的函数。数据/代码如下:

date<-c("2013-06-05","2013-06-05","2013-06-04","2013-06-04","2013-06-04","2013-06-04","2013-06-04",
    "2013-06-04","2013-06-04","2013-06-03","2013-06-03","2013-06-03","2013-06-03","2013-06-03",
    "2013-06-02","2013-06-02","2013-06-02","2013-06-02","2013-06-02","2013-06-02","2013-06-02")
start <-c("07:36:00","01:30:00","22:19:00","22:12:00","20:16:00","19:19:00","09:00:00",
     "06:45:00","01:03:00","22:15:00","19:05:00","08:59:00","08:01:00","07:08:00",
     "23:24:00","20:39:00","18:53:00","16:57:00","15:07:00","14:33:00","13:24:00")
duration <-c(0.5,6.1,2.18,0.12,1.93,0.95,10.32,
         2.25,5.7,2.78,3.17,9.03,0.95,0.88,
         7.73,2.75,1.77,1.92,1.83,0.57,1.13)
event <-c("AF201","SS431","BE201","CD331","HG511","CD331","WQ115",
      "CD331","SS431","WQ115","HG511","WQ115","CD331","AF201",
      "SS431","WQ115","HG511","WQ115","CD331","AS335","CD331")

df<-data.frame(date,start,duration,event)

library(ggplot2)
library(scales)

p <- ggplot(df, aes(as.Date(date),as.POSIXct(start,format='%H:%M:%S'),color=event))
p <- p+geom_point(alpha = I(6/10),size=5) 
p + ylab("time (hr)") + xlab("date") + scale_x_date(labels = date_format("%m/%d")) +
scale_y_datetime(labels = date_format("%H"))+
scale_colour_hue(h=c(360, 90))
theme(axis.text.x = element_text(hjust=1, angle=0))  
Run Code Online (Sandbox Code Playgroud)

结果图如下所示:

在此处输入图片说明

问题:不是简单地用一个点(如上所示)指示事件的开始时间,我如何绘制跨越事件持续时间的条形图?如上面的数据框所示,我有这个持续时间数据(以小时为单位)。或者,我可以提供“停止时间”(未显示)。

我想象这个解决方案看起来像一个堆积的条形图。但是,条形图并不完全正确,因为它假定条形图从图的底部开始,并且垂直堆叠的事件之间没有间隙。我的事件可能是不连续的——在沿 y 轴的不同位置“开始”和“停止”。解决方案还必须考虑到 1) 某些事件最终可能是并发的(时间重叠)和 2) 某些事件将跨越多天。

如有任何建议,我将不胜感激!

ale*_*han 5

有点不清楚您到底想要什么 - @Michele 的回答似乎不错,我不清楚您是否想使用,geom_rect因为它会使线条更粗(如果是这样,只需更改线宽),或者是否还有其他原因. 我决定尝试使用它geom_rect来启用闪避。我已经用 x 轴上的开始日期和 y 上的开始和结束时间绘制了它。我已经稍微不同地设置了数据来启用它。如果您追求不同的东西,请尝试使其明确,但至少这是另一种选择:

df<-data.frame(date,start,duration,event)

df <- transform(df,
                start = as.POSIXct(paste(date, start)),
                end   = as.POSIXct(paste(date, start)) + duration*3600)

df <- df[c("event", "start", "end")]

df$date <- strptime(df$start, "%Y-%m-%d")
df$start.new <- format(df$start, format = "%H:%M:%S")
df$end.new <- format(df$end, format = "%H:%M:%S")
df$day <- factor(as.POSIXct(df$date))
levels(df$day) <- 1:4
df$day <- as.numeric(as.character(df$day))
df$event.int <- df$event
levels(df$event.int) <- 1:7
df$event.int <- as.numeric(as.character(df$event.int))

p <- ggplot(df, aes(day, start)) + geom_rect(aes(ymin = start, ymax = end,
                                            xmin = (day - 0.45) + event.int/10,
                                            xmax = (day - 0.35) + event.int/10,
                                            fill = event)) +
  scale_x_discrete(limits = 1:4,breaks = 1:4, labels = sort(unique(date)),
                   name = "Start date") + ylab("Duration")
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明


Kap*_*ppa 4

感谢 (+1) @Michele 和 @alexwhan 的意见。使用 geom_rect 我能够获取同一日期、x 轴上同一点发生的所有事件。(我预计该数据集最终可能包含数月的事件。)

df<-data.frame(date,start,duration,event)

library(ggplot2)

p <- ggplot(df, aes(xmin=as.Date(date),xmax=as.Date(date)+1,
                    ymin=as.POSIXct(start,format='%H:%M:%S'),
                    ymax=as.POSIXct(start,format='%H:%M:%S')+duration*3600,
                    fill=event))
p <- p+geom_rect(alpha = I(8/10)) 
p + ylab("time") + xlab("date") + scale_x_date(labels = date_format("%m/%d")) +
scale_y_datetime(labels = date_format("%H"))+
scale_colour_hue(h=c(360, 90))
theme(axis.text.x = element_text(hjust=1, angle=0))   
Run Code Online (Sandbox Code Playgroud)

...结果是: 在此输入图像描述

这与我的目标非常接近。我认为我可以通过调整 alpha 来处理潜在的过度绘制问题。理想情况下,我希望 y 轴仅包含一天(00 到 00)。为此,我想我可能需要重新格式化数据,以便将持续时间超过午夜的事件重新分配到第二天。(不知道如何在 R 中执行此操作。)