Joe*_*e B 3 python pandas dummy-variable
我有一个字典,其中每个键都是一个行索引,每个值都是一个虚拟值列表。例如:
my_dict = {'row1': ['a', 'b'], 'row2': ['a'], 'row3': ['b', 'c']}
Run Code Online (Sandbox Code Playgroud)
我可以用上述方法有效地创建一个虚拟数据框吗?
>>> df
a b c
row1 True True False
row2 True False False
row3 False True True
Run Code Online (Sandbox Code Playgroud)
您可以使用pd.get_dummies:
u = pd.DataFrame.from_dict(my_dict, orient='index')
pd.get_dummies(u, prefix='', prefix_sep='').max(level=0, axis=1).astype(bool)
a b c
row1 True True False
row2 True False False
row3 False True True
Run Code Online (Sandbox Code Playgroud)
您也可以使用stackand ,str.get_dummies它是简洁的,但这会稍微慢一些。
u.stack().str.get_dummies().max(level=0).astype(bool)
a b c
row1 True True False
row2 True False False
row3 False True True
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
388 次 |
| 最近记录: |