我在R中生成以下虚拟变量时遇到问题:
我正在分析年度时间序列数据(时间段1948-2009).我有两个问题:
如何为观察#10生成虚拟变量,即1957年(1957年值= 1,否则为零)?
如何生成一个在1957年之前为零的虚拟变量,从1957年开始到2009年的值为1?
我需要创建一个新的数据帧nDF,它将所有分类变量二进制化,同时保留数据帧DF中的所有其他变量.例如,我有以下特征变量:RACE(4种类型)和AGE,以及一个名为CLASS的输出变量.
DF =
RACE AGE (BELOW 21) CLASS
Case 1 HISPANIC 0 A
Case 2 ASIAN 1 A
Case 3 HISPANIC 1 D
Case 4 CAUCASIAN 1 B
我希望将其转换为具有五(5)个变量或四(4)个变量的nDF:
RACE.1 RACE.2 RACE.3 AGE (BELOW 21) CLASS
Case 1 0 0 0 0 A
Case 2 0 0 1 1 A
Case 3 0 0 0 1 D
Case 4 0 1 0 1 B
我熟悉变量DF $ RACE 的治疗对比.但是,如果我实施
contrasts(DF$RACE) = contr.treatment(4)
Run Code Online (Sandbox Code Playgroud)
我得到的仍然是三个变量的DF,但是变量DF …