小编Ste*_*eMc的帖子

R中的高效方法是将新列添加到具有大数据集的数据框中

我真的需要加速一些R代码.我有一个特定运动的大型数据集.数据框中的每一行代表游戏中的某种类型的动作.对于每个游戏(game_id),我们有两个团队(team_id)参与游戏.time_ref在数据框中是每个游戏按时间顺序的动作.type_id是游戏中的动作类型.player_off被设置为TRUE或被FALSE链接到action_id=3.action_id=3代表玩家获得一张牌并被player_off设置为TRUE/ FALSE如果玩家在获得该牌时被罚下.示例data.frame:

> df

game_id team_id action_id   player_off  time_ref
100     10         1             NA       1000
100     10         1             NA       1001
100     10         1             NA       1002
100     11         1             NA       1003
100     11         2             NA       1004
100     11         1             NA       1005
100     10         3             1        1006
100     11         1             NA       1007
100     10         1             NA       1008
100     10         1 …
Run Code Online (Sandbox Code Playgroud)

r dataset dataframe dplyr data.table

1
推荐指数
1
解决办法
184
查看次数

标签 统计

data.table ×1

dataframe ×1

dataset ×1

dplyr ×1

r ×1