我想使用这些data.table函数通过在前面的行中引用它的值来更新列的值.这是一个例子
> DT<-data.table(id=1:2,x=1:10,y=1)
Run Code Online (Sandbox Code Playgroud)
我已经知道data.table可以通过以下方式引用前面的行:
> DT[,z:=cumsum(y),keyby=id]
> DT[]
id x y z
1: 1 1 1 1
2: 1 3 1 2
3: 1 5 1 3
4: 1 7 1 4
5: 1 9 1 5
6: 2 2 1 1
7: 2 4 1 2
8: 2 6 1 3
9: 2 8 1 4
10: 2 10 1 5
Run Code Online (Sandbox Code Playgroud)
但是,下一个示例不起作用,尝试Fibonacci使用列中的先前值创建一个序列y来更新自身.似乎data.table没有使用循环来迭代地执行计算.谁能告诉我如何data.table优雅地解决这类问题?
> DT[,y:=shift(y,1,fill=0)+shift(y,2,fill=0),]
> DT[]
id x y z
1: 1 1 0 1
2: 1 3 1 2
3: 1 5 2 3
4: 1 7 2 4
5: 1 9 2 5
6: 2 2 0 1
7: 2 4 1 2
8: 2 6 2 3
9: 2 8 2 4
10: 2 10 2 5
Run Code Online (Sandbox Code Playgroud)
我真正想要的是下面(列y更新):
id x y z
1: 1 1 1 1
2: 1 3 1 2
3: 1 5 2 3
4: 1 7 3 4
5: 1 9 5 5
6: 2 2 1 1
7: 2 4 1 2
8: 2 6 2 3
9: 2 8 3 4
10: 2 10 5 5
Run Code Online (Sandbox Code Playgroud)
根据定义,生成Fibonacci数是一个连续问题,我们可以data.table通过定义一个与for.loop引擎一起工作的自定义函数来解决这个问题.
# Define function
fibon <- function(x) {
for(i in 3:length(x)) x[i] = x[i-1] + x[i-2]
return(x)
}
# Plug into data.table
DT[,y := fibon(y), by = id]
> DT
# id x y z
#1: 1 1 1 1
#2: 1 3 1 2
#3: 1 5 2 3
#4: 1 7 3 4
#5: 1 9 5 5
#6: 2 2 1 1
#7: 2 4 1 2
#8: 2 6 2 3
#9: 2 8 3 4
#10: 2 10 5 5
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
695 次 |
| 最近记录: |