在熊猫中,我想计算参加每项运动的人的平均年龄和体重。我知道我可以循环,但想知道最有效的方法是什么。
df = pd.DataFrame([
[0, 1, 0, 30, 150],
[1, 1, 1, 25, 200],
[1, 0, 0, 20, 175]
], columns=[
"Plays Basketball",
"Plays Soccer",
"Plays Football",
"Age",
"Weight"
])
Run Code Online (Sandbox Code Playgroud)
| 打篮球 | 踢足球 | 踢足球 | 年龄 | 重量 |
|---|---|---|---|---|
| 0 | 1 | 0 | 30 | 150 |
| 1 | 1 | 1 | 25 | 200 |
| 1 | 0 | 0 | 20 | 175 |
我尝试过groupby,但它为每种可能的运动组合创建了一个组。我只需要每项运动的平均年龄和体重。
结果应该是:
| 年龄 | 重量 | |
|---|---|---|
| 打篮球 | 22.5 | 187.5 |
| 踢足球 | 27.5 | 175.0 |
| 踢足球 | 25.0 | 200.0 |