Ext*_*gma 6 python python-2.7 pandas
我有Pandas一系列10000行,其中填充了单个字母,从A到Z.但是,我想使用Pandas为A,B和C创建虚拟数据帧get_dummies.我该怎么做呢?
我不想为列中的所有行值获取假人,然后选择特定列,因为该列包含其他冗余数据,最终导致内存错误.
尝试这个:
# create mock dataframe
df = pd.DataFrame( {'alpha':['a','a','b','b','c','e','f','g']})
# use replace with a regex to set characters d-z to None
pd.get_dummies(df.replace({'[^a-c]':None},regex =True))
Run Code Online (Sandbox Code Playgroud)
输出:
alpha_a alpha_b alpha_c
0 1 0 0
1 1 0 0
2 0 1 0
3 0 1 0
4 0 0 1
5 0 0 0
6 0 0 0
7 0 0 0
Run Code Online (Sandbox Code Playgroud)