小编Jon*_*Jon的帖子

qqplot2 中的黄土置信区间过窄

我在理解使用 LOESS 平滑时如何计算置信区间时遇到一些困难ggplot2。从其他一些线程来看,我的理解是ggplot2使用基于回归标准误差计算的 t 区间,即使用实际数据点与 LOESS 线之间的距离。但我认为根据ggplot2产生的置信区间我一定是错误的。这是示例代码(实际上qplot在这种情况下,但我认为结果应该是相同的):

qplot(Year, Purposivism, data=fig1.dat, geom=c('point', 'smooth'), level=0.99, span=0.5, method='loess', ylab="Term Frequency per Million Words") +
theme_bw() +
theme(text=element_text(family="Century", size=12)) +
expand_limits(y = 0) +
scale_x_continuous(breaks = scales::pretty_breaks(n = 10)) +
theme(axis.text.x = element_text(angle = 45, hjust=1))
Run Code Online (Sandbox Code Playgroud)

这是结果图:

图形

在图的左侧(例如 1920-1940 年),点紧密排列在 LOESS 线周围,并且大部分位于置信区间内。但从 1960 年到 1980 年左右,它们到处都是,但置信区间的宽度似乎大致相同。我想我一定是误解了 CI 的工作原理,因为这看起来不直观。

在此先感谢您的帮助!非常乐意提供任何其他可能有用的信息。

continuous-integration r ggplot2 loess

3
推荐指数
1
解决办法
1263
查看次数

标签 统计

continuous-integration ×1

ggplot2 ×1

loess ×1

r ×1