我有一个不平衡的小组(对于大约80万人来说有700万观察).我想创建一个等于的新变量1,如果那个人曾经回答yes过另一个问题.具体来说,如果个体已经吸烟,我想创建一个等于1的假人.
所以,假设我的数据集看起来像这样(ID每个人都是独一无二的,有些人被采访过很多次,其他人只有一次):
ID Smoke
1 No
1 No
1 Yes
1 No
2 No
2 No
3 Yes
3 No
Run Code Online (Sandbox Code Playgroud)
我想生成一个变量Ever_Smoked,看起来像:
ID Smoke Ever_Smoked
1 No 1
1 No 1
1 Yes 1
1 No 1
2 No 0
2 No 0
3 Yes 1
3 No 1
Run Code Online (Sandbox Code Playgroud)
关于如何做到这一点的任何想法?提前致谢!