Sha*_*ang 3 python binary dataframe pandas categorical-data
我有以下熊猫数据框:
import pandas as pd
df = pd.read_csv("filename.csv")
df
A B C D E
0 a 0.469112 -0.282863 -1.509059 cat
1 c -1.135632 1.212112 -0.173215 dog
2 e 0.119209 -1.044236 -0.861849 dog
3 f -2.104569 -0.494929 1.071804 bird
4 g -2.224569 -0.724929 2.234213 elephant
...
Run Code Online (Sandbox Code Playgroud)
我想基于分类值的标识创建更多列,以column E使数据框如下所示:
df
A B C D cat dog bird elephant ....
0 a 0.469112 -0.282863 -1.509059 -1 0 0 0
1 c -1.135632 1.212112 -0.173215 0 -1 0 0
2 e 0.119209 -1.044236 -0.861849 0 -1 0 0
3 f -2.104569 -0.494929 1.071804 0 0 -1 0
4 g -2.224569 -0.724929 2.234213 0 0 0 0
...
Run Code Online (Sandbox Code Playgroud)
也就是说,我根据的值将column的值旋转为E一个二进制矩阵E,给出1该值是否存在,0对于所有其他不存在的值(在这里,我希望它为-1或“负二进制矩阵” ”)?
我不确定熊猫中哪个函数最能做到这一点:也许pandas.DataFrame.unstack()?
任何见解表示赞赏!
使用pd.concat,drop和get_dummies
pd.concat([df.drop('E', 1), pd.get_dummies(df.E).mul(-1)], axis=1)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
946 次 |
| 最近记录: |