相关疑难解决方法(0)

如何制作一个很好的R可重复的例子

在与同事讨论性能,教学,发送错误报告或在邮件列表上搜索指导时,以及在Stack Overflow上,通常会询问可重复的示例并始终提供帮助.

您有什么建议创建优秀示例的提示?如何以文本格式粘贴中的数据结构?您还应该包含哪些其他信息?

在另外还有其他招数来使用dput(),dump()structure()?你什么时候应该包括library()require()声明?其中保留字应避免一个,此外c,df,data等?

怎样才能成为一位伟大的重复的例子?

r r-faq

2474
推荐指数
23
解决办法
28万
查看次数

当有多个因子水平作为基线时,如何解释R线性回归?

我的数据有3个独立变量,所有变量都是分类的:

condition: cond1, cond2, cond3

population: A,B,C

task: 1,2,3,4,5
Run Code Online (Sandbox Code Playgroud)

因变量是任务完成时间.我lm(time~condition+user+task,data)在R中运行并得到以下结果:

在此输入图像描述

令我困惑的是,cond1,groupA和task1被排除在结果之外.从线性回归"NA"仅估计最后一个系数,我理解选择一个因子水平作为"基线"并显示在(拦截)行中.

但是,如果有多个因子水平用作基线,如上所述呢?

  • (拦截)行现在是否表示cond1 + groupA + task1?
  • 如果我想分别了解cond1,groupA和task1的系数和重要性怎么办?
  • 例如,与groupA相比,groupB的估计系数为+9.3349?或者与cond1 + groupA + task1相比?

statistics r linear-regression

6
推荐指数
1
解决办法
1万
查看次数

为什么R中的回归删除因子变量的索引1?

我正在尝试使用lmglm函数在R中进行回归.

我的因变量是基于在给定时间段内非事件的事件比例的logit变换数据.所以我的因变量是连续的,而我的自变量是因子变量或虚拟变量.

我有两个可以取值的自变量

  • 年份i到年份m,我的YEAR变量
  • 月j到月n,我的MONTH变量

问题是每当我运行我的模型作为摘要时,结果4月(月份指数1)和1998年(年份指数1)不在结果范围内......如果我改变4月份让我们说"foo_bar",8月将是失踪...

请帮忙!这令我感到沮丧,我根本不知道如何寻找问题的解决方案.

statistics regression r linear-regression

1
推荐指数
1
解决办法
4246
查看次数

标签 统计

r ×3

linear-regression ×2

statistics ×2

r-faq ×1

regression ×1