我的数据集看起来完全像这样(只有更多的观察值和属性):
我希望每个属性都有一个二进制变量,如果PersonX拥有它,则值为1,否则为0,但是每个人还必须包括其他人的属性。它应该看起来像这样,当然,如果Person1也具有与Person2相同的属性,则不应再次生成该变量:
ID Class_Label A469 T593 K022K A835 Z935 U83F W5326
Person1 TRUE 1 1 1 0 0 0 0
Person2 FALSE 0 1 0 1 1 0 0
Person3 FALSE 0 0 1 0 0 1 1
Run Code Online (Sandbox Code Playgroud)
如您所见,Person1和Person3具有以下属性:公共属性K022K和Person1和Person2 T593。有什么办法解决这个问题吗?