我有一个数据框,其中一列是我的每个用户所属的组列表.就像是:
index groups
0 ['a','b','c']
1 ['c']
2 ['b','c','e']
3 ['a','c']
4 ['b','e']
Run Code Online (Sandbox Code Playgroud)
我想要做的是创建一系列虚拟列,以确定每个用户所属的组,以便运行一些分析
index a b c d e
0 1 1 1 0 0
1 0 0 1 0 0
2 0 1 1 0 1
3 1 0 1 0 0
4 0 1 0 0 0
pd.get_dummies(df['groups'])
Run Code Online (Sandbox Code Playgroud)
将无法工作,因为它只返回列中每个不同列表的列.
解决方案需要高效,因为数据帧将包含500,000多行.任何意见,将不胜感激!