相关疑难解决方法(0)

如何在R中模拟SQL"分区依据"?

如何在R数据帧上执行分析函数,如Oracle ROW_NUMBER(),RANK()或DENSE_RANK()函数(请参阅http://www.orafaq.com/node/55)?CRAN包"plyr"非常接近,但仍然不同.

我同意每个功能的功能可以以特别的方式实现.但我主要担心的是表现.为了记忆和速度,最好避免使用连接或索引访问.

sql r dense-rank dplyr data.table

17
推荐指数
2
解决办法
1万
查看次数

"循环"data.table来计算条件平均值

我想"遍历"data.table的行并计算每行的平均值.平均值应根据以下机制计算:

  1. 在第i行查找标识符ID(ID(i))
  2. 在第i行中查找T2的值(T2(i))
  3. 计算满足以下两个标准的Data1所有行中的值的平均值j:ID(j) = ID(i)T1(j) = T2(i)
  4. 在第i行的Data2列中输入计算的平均值

     DF = data.frame(ID=rep(c("a","b"),each=6), 
                 T1=rep(1:2,each=3), T2=c(1,2,3), Data1=c(1:12))
     DT = data.table(DF)
     DT[ , Data2:=NA_real_]
         ID T1 T2  Data1 Data2
    [1,]  a  1  1     1    NA
    [2,]  a  1  2     2    NA
    [3,]  a  1  3     3    NA
    [4,]  a  2  1     4    NA
    [5,]  a  2  2     5    NA
    [6,]  a  2  3     6    NA
    [7,]  b  1  1     7    NA
    [8,]  b  1  2     8 …
    Run Code Online (Sandbox Code Playgroud)

r data.table

11
推荐指数
1
解决办法
4576
查看次数

标签 统计

data.table ×2

r ×2

dense-rank ×1

dplyr ×1

sql ×1