相关疑难解决方法(0)

生成虚拟变量

我在R中生成以下虚拟变量时遇到问题:

我正在分析年度时间序列数据(时间段1948-2009).我有两个问题:

  1. 如何为观察#10生成虚拟变量,即1957年(1957年值= 1,否则为零)?

  2. 如何生成一个在1957年之前为零的虚拟变量,从1957年开始到2009年的值为1?

r r-faq

68
推荐指数
12
解决办法
28万
查看次数

[R] |中的单热编码 分类为虚拟变量

我需要创建一个新的数据帧nDF,它将所有分类变量二进制化,同时保留数据帧DF中的所有其他变量.例如,我有以下特征变量:RACE(4种类型)和AGE,以及一个名为CLASS的输出变量.

DF =

              RACE     AGE (BELOW 21)      CLASS
Case 1    HISPANIC                  0          A
Case 2       ASIAN                  1          A
Case 3    HISPANIC                  1          D
Case 4   CAUCASIAN                  1          B

我希望将其转换为具有五(5)个变量或四(4)个变量的nDF:

          RACE.1    RACE.2    RACE.3      AGE (BELOW 21)     CLASS
Case 1         0         0         0                   0         A
Case 2         0         0         1                   1         A
Case 3         0         0         0                   1         D
Case 4         0         1         0                   1         B

我熟悉变量DF $ RACE 的治疗对比.但是,如果我实施

contrasts(DF$RACE) = contr.treatment(4)
Run Code Online (Sandbox Code Playgroud)

我得到的仍然是三个变量的DF,但是变量DF …

r categorical-data

18
推荐指数
1
解决办法
3万
查看次数

标签 统计

r ×2

categorical-data ×1

r-faq ×1