相关疑难解决方法(0)

关于data.table 1.9.2中的GForce

我不知道如何在data.table 1.9.2中充分利用GForce

新的优化:GForce.不是对数据进行分组,而是将组位置传递到sum和mean(gsum和gmean)的分组版本,然后计算单个顺序传递列中所有组的结果以获得缓存效率.此外,由于g*函数只被调用一次,我们不需要找到加速调用sum的方法或重复每个组的平均值.`

提交以下代码时

DT <- data.table(A=c(NA,NA,1:3), B=c("a",NA,letters[1:3]))
DT[,sum(A,na.rm=TRUE),by= B]
Run Code Online (Sandbox Code Playgroud)

我懂了

    B V1
1:  a  1
2: NA  0
3:  b  2
4:  c  3

DT[,sum(A,na.rm=FALSE),by= B]我尝试时,我得到了

    B  V1
1:  a  NA
2:  NA NA
3:  b  2
4:  c  3

这个结果是否解释了GForce的作用,添加na.rm = TRUE/FALSE选项?

非常感谢!

r data.table

14
推荐指数
1
解决办法
2019
查看次数

标签 统计

data.table ×1

r ×1