我有一个像下面这样的数据框(尽管更大)。
姓名 | 年龄 | 性别 | 最喜欢的颜色 | 年级 | 分数 |
---|---|---|---|---|---|
蒂姆 | 不适用 | 不适用 | 蓝色的 | 12 | 100 |
蒂姆 | 18 | 男性 | 红色的 | 12 | 50 |
戴夫 | 17 号 | 男性 | 红色的 | 12 | 85 |
麦克风 | 15 | 男性 | 绿色的 | 10 | 95 |
约翰 | 12 | 男性 | 不适用 | 7 | 80 |
约翰 | 12 | 不适用 | 橙子 | 7 | 90 |
有几件事我想做。我的主要目标是按名称变量合并行,以便每个名称获得一行。其次,在合并行时,我希望包含数据的单元格覆盖 NA 的单元格(tim withage
和sex
)。第三,如果要合并的行都具有文本值(例如 tim with favcolor
),我想保留第一个。最后,对于在数字列( age
、grade
和)中都有值的行score
,我希望新值是合并行的平均值。
如果遵循所有这些规则,数据框应该看起来像这样。
姓名 | 年龄 | 性别 | 最喜欢的颜色 | 年级 | 分数 |
---|---|---|---|---|---|
蒂姆 | 18 | 男性 | 蓝色的 | 12 | 75 |
戴夫 | 17 号 | 男性 | 红色的 … |