我有以下格式的熊猫数据框:
user percent
x 0.2
x 0.5
x 0.8
y 0.1
y 0.6
y 0.2
y 0.6
Run Code Online (Sandbox Code Playgroud)
我正在尝试为每个用户乘以行中的百分比。
在示例中,x 的结果将为 0.2*0.5*0.8 = 0.08
因此,数据框应如下所示:
user result
x 0.08
y 0.0072
Run Code Online (Sandbox Code Playgroud)
如何获得我的预期输出?
我想计算每个 id 的所有行中 True 值的百分比。
这是我的数据示例:
id col1
1 True
1 True
1 False
1 True
2 False
2 False
Run Code Online (Sandbox Code Playgroud)
新列应如下所示:
id col1 num_true
1 True 0.75
1 True 0.75
1 False 0.75
1 True 0.75
2 False 0
2 False 0
Run Code Online (Sandbox Code Playgroud)
这就是我试图做的:
df['num_true']= df[df['col1'] == 'True'].groupby('id')['col1'].count()
df['num_col1_id']= df.groupby('id')['col1'].transform('count')
df['perc_true']= df.num_true/df.num_col1_id
Run Code Online (Sandbox Code Playgroud)