将矢量拆分为相等值的连续运行

Question

将矢量拆分为相等值的连续运行

我有一个数据表,其中一列是一堆0和1,如下vec所示.

vec = c(rep(1, times = 6), rep(0, times = 10), rep(1, times = 11), rep(0, times = 4))

> vec
 [1] 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0

Run Code Online (Sandbox Code Playgroud)

我想要做的是每当该列的变化从0变为1时分割数据,反之亦然.这是我到目前为止所做的:

b = c(vec[1],diff(vec))

rowby = numeric(0)
for (i in 2:(length(b))) {
  if (b[i] != 0) {
    rowby <- c(rowby, i-1)
  } 
}
splitted_data <- split(vec, cumsum(c(TRUE,(1:length(vec) %in% rowby)[-length(vec)])))

Run Code Online (Sandbox Code Playgroud)

我的鼻子下面肯定有一些我看不到的东西.这样做的正确方法是什么？这适用于上面的示例,但不是一般的.

Answer 1

akr*_*run 6

尝试

 split(vec,cumsum(c(1, abs(diff(vec)))))
 #$`1`
 #[1] 1 1 1 1 1 1

 #$`2`
 #[1] 0 0 0 0 0 0 0 0 0 0

 #$`3`
 #[1] 1 1 1 1 1 1 1 1 1 1 1

 #$`4`
 #[1] 0 0 0 0

Run Code Online (Sandbox Code Playgroud)

或者使用 rle

 split(vec,inverse.rle(within.list(rle(vec), values <- seq_along(values))))

Run Code Online (Sandbox Code Playgroud)

使用当前版本data.table,rleid是一个可用于此作业的功能:

 library(data.table)#v1.9.5+
 split(vec,rleid(vec))

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，8 月前
查看次数：	338 次
最近记录：	8 年，2 月前