R中虚拟变量的回归

Trg*_*vec 4 regression r dummy-variable

我是 R 新手,我正在尝试对我的数据集进行回归,其中包括一家公司多年来在不同国家/地区的月度销售数据。

在其他统计程序中,为了控制销售的季度周期性变动以及区域(国家)差异,我将创建虚拟变量来指示例如进行销售的季度和国家。

我的问题:

1)我看到在 R 中你可以将变量类型设置为“Factor”。在这种情况下,我是否仍然需要创建指示国家和月份/季度的虚拟变量,或者 R 是否已经以不同方式处理因子变量并在后台自动将它们转换为虚拟变量?

2)如果上述情况并非如此,并且我确实需要将我的值重新编码为0,1虚拟值,那么R中有一个简洁的标准方法可以做到这一点吗?

非常感谢您的帮助,祝您有美好的一天!

特尔戈韦茨

Ori*_*osa 5

是的,R 会自动将因子变量视为参考虚拟变量,因此您无需执行任何其他操作,并且如果运行回归,您应该会看到这些因子的虚拟变量的典型输出。

但请注意,有多种对分类变量进行编码的方法,因此您可能希望使用该函数执行不同的操作C您可以在这里找到详细信息。此外,如果您需要更多控制,还有一些软件包专门帮助您创建虚拟变量,例如dummies软件包。