plot.lm()如何确定残差与拟合图的哪些点是异常值(即标记的内容)?我在文档中找到的唯一一件事是:
细节
sub.caption-默认情况下,函数调用 - 在每个绘图上显示为副标题(在x轴标题下),当绘图位于不同页面上时,或者当有多个绘图时作为外边距中的副标题(如果有)每页.
'Scale-Location'图也称为'Spread-Location'或'S-L'图,它采用绝对残差的平方根来减小偏度(sqrt(| E |))比| | E | 对于高斯零均值E).
'S-L',QQ和剩余杠杆图使用具有相同方差的标准化残差(在假设下).它们以R [i] /(s*sqrt(1-h.ii))给出,其中h.ii是帽子矩阵的对角线条目,影响()$ hat(另见帽子),以及残差 - 杠杆图使用R [i]的标准化Pearson残差(residuals.glm(type ="pearson")).
Residual-Leverage图显示Cook的距离等于Cook.levels的值(默认为0.5和1),并省略带有警告的杠杆的情况.如果杠杆率是恒定的(通常是在平衡的aov情况下的情况),则该图使用因子水平组合而不是x轴的杠杆作用.(因子水平按平均拟合值排序.)
在Cook的距离与杠杆/(1-leverage)图中,幅度相等的标准化残差的轮廓是通过原点的线.轮廓线标有大小.
但它没有说明如何生成残差与拟合图以及如何选择要标记的点.
更新:Zheyuan Li的回答表明,残差与拟合图标点的方式实际上只是通过查看残差最大的3个点.确实如此.它可以通过以下"极端"示例来证明.
x = c(1,2,3,4,5,6)
y = c(2,4,6,8,10,12)
foo = data.frame(x,y)
model = lm(y ~ x, data = foo)
Run Code Online (Sandbox Code Playgroud)
请看这个例子。我正在使用 GNU CLISP 2.49。
(defparameter *pudding-eater* 'henry')
;; output:
READ from
#<INPUT CONCATENATED-STREAM #<INPUT STRING-INPUT-STREAM> #<IO TERMINAL-STREAM>>: an
object cannot start with #\)
(defparameter *pudding-eater* 'henry)
;; output:
*PUDDING-EATER*
Run Code Online (Sandbox Code Playgroud)
我确实明白是双引号引起了问题。我不明白的是,什么an object cannot start with #\)意思?我从哪里开始#\)?我期待一些错误消息,如umatched parenthesis.
我有一个数据集,有一个名为date的变量.它看起来像"31MAY13:00:00:00",其数据类型是日期.现在我想创建一个新变量,使其成为相应月份的第一天.所以对于"31MAY13:00:00:00",它会给我"01MAY13:00:00:00".这是我的代码:
DATA newdata;
SET olddata;
newvariable = INTNX('month',olddate,0,"B");
RUN;
Run Code Online (Sandbox Code Playgroud)
日志说:函数INTNX的参数2无效.我和SAS合作已经有一段时间了.任何的想法?非常感谢!