小编use*_*369的帖子

熊猫将列表列表转换为虚拟对象

我有一个数据框,其中一列是我的每个用户所属的组列表.就像是:

index groups  
0     ['a','b','c']
1     ['c']
2     ['b','c','e']
3     ['a','c']
4     ['b','e']
Run Code Online (Sandbox Code Playgroud)

我想要做的是创建一系列虚拟列,以确定每个用户所属的组,以便运行一些分析

index  a   b   c   d   e
0      1   1   1   0   0
1      0   0   1   0   0
2      0   1   1   0   1
3      1   0   1   0   0
4      0   1   0   0   0


pd.get_dummies(df['groups'])
Run Code Online (Sandbox Code Playgroud)

将无法工作,因为它只返回列中每个不同列表的列.

解决方案需要高效,因为数据帧将包含500,000多行.任何意见,将不胜感激!

python pandas

31
推荐指数
4
解决办法
1万
查看次数

标签 统计

pandas ×1

python ×1