我还是这个组和 R 的新手。我对上次查询有一些非常有用的反馈,所以希望我可以通过以下方式获得更多支持:
我正在研究一个赛马数据库,该数据库在这个阶段有 4 个变量:赛马编号、比赛 ID、比赛距离和为比赛中的马匹表现分配的评级 (DaH)。
数据集:
horse_ratings <- tibble(
horse=c(1,1,1,2,2,2,3,3,3),
raceid=c(1,2,3,1,2,3,1,2,3),
Dist=c(9.47,9.47,10,10.1,10.2,9,11,9.47,10.5),
DaH=c(101,99,103,101,94,87,102,96,62)
)
Run Code Online (Sandbox Code Playgroud)
给予:
> horse_ratings
# A tibble: 9 x 4
horse raceid Dist DaH
<dbl> <dbl> <dbl> <dbl>
1 1 1 9.47 101
2 1 2 9.47 99
3 1 3 10 103
4 2 1 10.1 101
5 2 2 10.2 94
6 2 3 9 87
7 3 1 11 102
8 3 2 9.47 96
9 3 3 10.5 62
Run Code Online (Sandbox Code Playgroud)
我将在数据集上执行许多计算,例如平均评分、最大评分等,这些计算会产生许多相等长度的向量。 …