我不知道如何在data.table 1.9.2中充分利用GForce
新的优化:GForce.不是对数据进行分组,而是将组位置传递到sum和mean(gsum和gmean)的分组版本,然后计算单个顺序传递列中所有组的结果以获得缓存效率.此外,由于g*函数只被调用一次,我们不需要找到加速调用sum的方法或重复每个组的平均值.`
提交以下代码时
DT <- data.table(A=c(NA,NA,1:3), B=c("a",NA,letters[1:3]))
DT[,sum(A,na.rm=TRUE),by= B]
Run Code Online (Sandbox Code Playgroud)
我懂了
B V1
1: a 1
2: NA 0
3: b 2
4: c 3
当DT[,sum(A,na.rm=FALSE),by= B]我尝试时,我得到了
B V1
1: a NA
2: NA NA
3: b 2
4: c 3
这个结果是否解释了GForce的作用,添加na.rm = TRUE/FALSE选项?
非常感谢!