Hei*_*erg 2 python dataframe pandas
我的数据框如下所示:列名称'Types'shows每种类型都有所不同
我想添加另一个名为'number'的列,如下所示.
df=pd.DataFrame({'Sex':['M','F','F','M'],'Age':[30,31,33,32],'Types':['A','C','B','D']})
Out[8]:
Age Sex Types
0 30 M A
1 31 F C
2 33 F B
3 32 M D
Run Code Online (Sandbox Code Playgroud)
我下面还有另一张男表; 每列代表类型!
(很难为我创建表格,还有另一种简单的方法可以创建吗?)
table_M = pd.DataFrame(np.arange(20).reshape(4,5),index=[30,31,32,33],columns=["A","B","C","D","E"])
table_M.index.name="Age(male)"
A B C D E
Age(male)
30 0 1 2 3 4
31 5 6 7 8 9
32 10 11 12 13 14
33 15 16 17 18 19
Run Code Online (Sandbox Code Playgroud)
我下面有女表;
table_F = pd.DataFrame(np.arange(20,40).reshape(4,5),index=[30,31,32,33],columns=["A","B","C","D","E"])
table_F.index.name="Age(female)"
A B C D E
Age(female)
30 20 21 22 23 24
31 25 26 27 28 29
32 30 31 32 33 34
33 35 36 37 38 39
Run Code Online (Sandbox Code Playgroud)
所以我想添加'number'列,如下所示;
Age Sex Types number
0 30 M A 0
1 31 F C 27
2 33 F B 36
3 32 M D 13
Run Code Online (Sandbox Code Playgroud)
这个数字栏是指女性和男性表.对于每个年龄,类型和性别.这对我来说太复杂了.我可以问一下如何添加"数字"栏吗?
我建议重塑你的男女表:
males = (table_M.stack().to_frame('number').assign(Sex='M').reset_index()
.rename(columns={'Age(male)': 'Age', 'level_1': 'Types'}))
females = (table_F.stack().to_frame('number').assign(Sex='F').reset_index()
.rename(columns={'Age(female)': 'Age', 'level_1': 'Types'}))
reshaped = pd.concat([males, females], ignore_index=True)
Run Code Online (Sandbox Code Playgroud)
然后合并:
df.merge(reshaped)
Out:
Age Sex Types number
0 30 M A 0
1 31 F C 27
2 33 F B 36
3 32 M D 13
Run Code Online (Sandbox Code Playgroud)
这样做是为了堆叠男性和女性表格的列,并指定一个显示性别('M'和'F')的指标栏.females.head()看起来像这样:
females.head()
Out:
Age Types number Sex
0 30 A 20 F
1 30 B 21 F
2 30 C 22 F
3 30 D 23 F
4 30 E 24 F
Run Code Online (Sandbox Code Playgroud)
并且males.head():
males.head()
Out:
Age Types number Sex
0 30 A 0 M
1 30 B 1 M
2 30 C 2 M
3 30 D 3 M
4 30 E 4 M
Run Code Online (Sandbox Code Playgroud)
使用pd.concat,这两个组合成一个DataFrame,默认情况下合并在公共列上,因此它在'Age','Sex','Types'列中查找匹配,并根据它合并两个DataFrame.
另一种可能是使用df.lookup:
df.loc[df['Sex']=='M', 'number'] = table_M.lookup(*df.loc[df['Sex']=='M', ['Age', 'Types']].values.T)
df.loc[df['Sex']=='F', 'number'] = table_F.lookup(*df.loc[df['Sex']=='F', ['Age', 'Types']].values.T)
df
Out:
Age Sex Types number
0 30 M A 0.0
1 31 F C 27.0
2 33 F B 36.0
3 32 M D 13.0
Run Code Online (Sandbox Code Playgroud)
这会查找男性table_M和女性table_F.