不确定这是否是一个编程问题......
如果我有下面的数据,它产生一个'尖尖'图表,并且我想用ggplot2产生一个稍微平滑的数据,我该如何最优雅地去做.通常的平滑方法会删除太多信息.我正在考虑的一种方法是在当前集合之间插入额外的两个数据点,然后采用2个周期移动平均值等.这似乎是手动编码的艰苦工作,所以我会采取一种优雅自动化的答案作为最后的手段.
a=data.frame(year=paste('FY',2001:2012,sep='.'),values=rnorm(12))
library(ggplot2)
正如你所看到的,这是尖刻的,视觉上没有吸引力
ggplot(a,aes(x=year,y=values,group=1))+geom_line() 
这会从图表中删除太多信息
ggplot(a,aes(x=year,y=values,group=1))+stat_smooth(se=F) 
谢谢
你可以尝试多项式.由于x轴变量具有12个唯一值,因此可以使用高达11度的多项式.此外,您应该使用x轴的连续标度来获得平滑的曲线.
这是一个8阶多项式的例子:
ggplot(a, aes(x = year, y = values, group = 1))+
  stat_smooth(aes(x = seq(length(unique(year)))), # continuous x-axis
              se = F, method = "lm", formula = y ~ poly(x, 8)) +
  scale_x_continuous(breaks = seq(length(unique(a$year))), 
                     labels = levels(a$year)) # original labels
这里,method = "lm"意味着使用线性模型.poly函数的第二个参数指定度.

如果您想避免从数据中丢失太多信息,下面可能是一种更好的方法,适用于大型数据集:
library(zoo)
library(reshape)
a$smooth<-rollmean(a$values,3,fill="extend") # 2nd parameter defines smoothness 
ggplot(melt(a),aes(x=year,y=value,color=variable,group=variable))+geom_line()

这是一个更好的例子:
a <- data.frame(year=1:10,values=sin(1:10)+runif(10))
a$smooth<-rollmean(a$values,3,fill="extend")
ggplot(melt(a,id.vars="year"),aes(x=year,y=value,color=variable,
      group=variable))+geom_line(size=2)
