jwi*_*720 2 python group-by pandas pandas-groupby
有人可以帮助我(大熊猫)中的(可能的)群体.
这是df:
easy_donor v_fam count
0 donor_1_NS IGHV1 5202376
1 donor_1_NS IGHV2 1955547
2 donor_1_NS IGHV3 70426272
3 donor_1_NS IGHV4 452367
4 donor_1_NS IGHV5 4842145
5 donor_1_NS IGHV6 490142
6 donor_1_NS IGHV7 19708
24 donor_2_NS IGHV1 31258603
25 donor_2_NS IGHV2 5295899
26 donor_2_NS IGHV3 47286417
27 donor_2_NS IGHV4 44553802
Run Code Online (Sandbox Code Playgroud)
然后我希望每个计数作为由捐赠者分组的计数总和的频率.
喜欢:
df.groupby('easy_donor').sum()['count']
easy_donor
donor_1_NS 83394639
donor_2_NS 129191591
donor_3_HS 220549762
donor_3_NS 104821016
donor_4_HS 200444923
donor_4_NS 121287306
Run Code Online (Sandbox Code Playgroud)
然后,如果它们与easy_donor列匹配,则原始数据帧中的每个计数除以groupby总和.我是否必须加入原始数据框?
尝试:
df.groupby('easy_donor')["count"].apply(lambda x: x / x.sum())
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4126 次 |
| 最近记录: |