我有一个pandas dataFrame,其中一列如下所示:
In [207]:df2.teams
Out[207]:
0 [SF, NYG]
1 [SF, NYG]
2 [SF, NYG]
3 [SF, NYG]
4 [SF, NYG]
5 [SF, NYG]
6 [SF, NYG]
7 [SF, NYG]
Run Code Online (Sandbox Code Playgroud)
我需要使用pandas将这列列表拆分为2列,名为team1和team2
我有一个数据框,其中一列是我的每个用户所属的组列表.就像是:
index groups
0 ['a','b','c']
1 ['c']
2 ['b','c','e']
3 ['a','c']
4 ['b','e']
Run Code Online (Sandbox Code Playgroud)
我想要做的是创建一系列虚拟列,以确定每个用户所属的组,以便运行一些分析
index a b c d e
0 1 1 1 0 0
1 0 0 1 0 0
2 0 1 1 0 1
3 1 0 1 0 0
4 0 1 0 0 0
pd.get_dummies(df['groups'])
Run Code Online (Sandbox Code Playgroud)
将无法工作,因为它只返回列中每个不同列表的列.
解决方案需要高效,因为数据帧将包含500,000多行.任何意见,将不胜感激!