类似于在列表中查找连续数字组和在 R 中查找向量中的连续值,不同之处在于我有一个可能高达 4 的数字序列,即
y=c(4*1:4,24,31,33,39,4*16:20)
> y
[1] 4 8 12 16 24 31 33 39 64 68 72 76 80
Run Code Online (Sandbox Code Playgroud)
我想要一个函数来返回每个由最多 4 个分隔的值序列,所以我得到:
4 8 12 16 # all sep by at most 4
31 33 # all sep by at most 4
64 68 72 76 80 # all sep by at most 4
Run Code Online (Sandbox Code Playgroud)
我试过:
st=c(1,which(diff(y)<5)+1)
en=c(st-1,length(y))
y[st]
[1] 4 8 12 16 33 68 72 76 80
y[en]
[1] 4 8 12 31 64 68 72 76 80
Run Code Online (Sandbox Code Playgroud)
无济于事。
我确定我遗漏了一些明显的东西,并且希望得到任何提示。
这是你追求的吗?
split(y, cumsum(c(0, diff(y) > 4)));
#$`0`
#[1] 4 8 12 16
#
#$`1`
#[1] 24
#
#$`2`
#[1] 31 33
#
#$`3`
#[1] 39
#
#$`4`
#[1] 64 68 72 76 80
Run Code Online (Sandbox Code Playgroud)
我没有看到24你的list; 这是一个错误吗?
如果您想排除list只有一个数字的条目,您可以在一行中完成所有操作:
Filter(length, lapply(split(y, cumsum(c(0, diff(y) > 4))), function(x) x[length(x) > 1]));
#$`0`
#[1] 4 8 12 16
#
#$`2`
#[1] 31 33
#
#$`4`
#[1] 64 68 72 76 80
Run Code Online (Sandbox Code Playgroud)