van*_*eri 5 r ggplot2 quantreg
这是我可重复的数据:
library("ggplot2")
library("ggplot2movies")
library("quantreg")
set.seed(2154)
msamp <- movies[sample(nrow(movies), 1000), ]
Run Code Online (Sandbox Code Playgroud)
我正在尝试熟悉stat_quantile,但文档中的示例提出了几个问题.
mggp <- ggplot(data=msamp, mapping=aes(x=year, y=rating)) +
geom_point() +
stat_quantile(formula=y~x, quantiles=c(0, 0.25, 0.50, 0.75, 1)) +
theme_classic(base_size = 12) +
ylim(c(0,10))
mggp
Run Code Online (Sandbox Code Playgroud)
根据我的理解,分位数将数据分成小于定义的截止值的部分,对吗?如果我像下面的代码中那样定义分位数,我得到五行.为什么?它们代表什么?
似乎分位数是基于y轴上的因变量(评级)计算的.有可能扭转这种局面吗?我的意思是根据"年份"中的分位数分割数据?
该函数执行分位数回归,每条线都是一个指标
来自维基百科:
分位数回归是统计学和计量经济学中使用的一种回归分析。最小二乘法得出的估计值在给定预测变量的某些值的情况下近似响应变量的条件平均值,而分位数回归旨在估计响应变量的条件中位数或其他分位数。
因此,回归图中的每条线都是分位数值的估计值,例如中位数、第 75 个百分位数和第 100 个百分位数。
您可以在quantreg包的小插图中找到详细的技术讨论。