R中的交织列表

pap*_*rin 29 r

假设我在R中有两个列表,不一定长度相同,如:

 a <- list('a.1','a.2', 'a.3')
 b <- list('b.1','b.2', 'b.3', 'b.4')
Run Code Online (Sandbox Code Playgroud)

构造交错元素列表的最佳方法是什么,一旦添加了较短列表的元素,较长列表的其余元素将追加到末尾?,​​如:

interleaved <- list('a.1','b.1','a.2', 'b.2', 'a.3', 'b.3','b.4')
Run Code Online (Sandbox Code Playgroud)

不使用循环.我知道mapply适用于两个列表长度相等的情况.

Aru*_*run 36

这是一种方式:

idx <- order(c(seq_along(a), seq_along(b)))
unlist(c(a,b))[idx]

# [1] "a.1" "b.1" "a.2" "b.2" "a.3" "b.3" "b.4"
Run Code Online (Sandbox Code Playgroud)

正如@James指出的那样,既然你需要一个列表,你应该这样做:

(c(a,b))[idx]
Run Code Online (Sandbox Code Playgroud)

  • @Arun前面的`unlist`并且只使用`c(a,b)[idx]`可能更好,因为一般来说,项目复杂的对象会被`unlist`破坏. (2认同)

Mar*_*ars 27

在研究类似的问题时,我遇到了Gabor Grothendieck(即@GGrothendieck?)针对某些案例的这个美妙的解决方案:

c(rbind(a,b))
Run Code Online (Sandbox Code Playgroud)

这同样适用时a,并b都列出,或在ab是两个向量.这不是一个精确的解决方案,OP的问题,因为当ab具有不同的长度,将回收的短序列的元素,打印警告.然而,由于这个解决方案简单而优雅,并且提供了一个非常相似的问题的答案 - 一些人(像我一样)的问题,他们找到了通往此页面的方式 - 似乎值得添加作为答案.


jor*_*ran 5

这是使用ggplot2interleave函数的一个选项.我相信这可以改进,但这是一个开始:

require(ggplot2)
Interleave <- function(x,y){
    v <- list(x,y)
    lengths <- sapply(v,length)
    mn <- min(lengths)
    v <- v[order(lengths)]
    c(ggplot2:::interleave(v[[1]],v[[2]][seq_len(mn)]),v[[2]][(mn+1):length(v[[2]])])
}

Interleave(a,b)
Interleave(b,a)
Run Code Online (Sandbox Code Playgroud)

特别是,如果列表实际上是相同的长度,这将做奇怪的事情.也许有人会在v[[2]]最后一行中使用更好的方法来编写索引以避免这种退化情况.


Ric*_*rta 5

interleave(a, b)

# unlist(interleave(a, b))
# [1] "a.1" "b.1" "a.2" "b.2" "a.3" "b.3" "b.4"


interleave <- function(a, b) { 

  shorter <- if (length(a) < length(b)) a else b
  longer  <- if (length(a) >= length(b)) a else b

  slen <- length(shorter)
  llen <- length(longer)


  index.short <- (1:slen) + llen
  names(index.short) <- (1:slen)

  lindex <- (1:llen) + slen
  names(lindex) <- 1:llen


  sindex <- 1:slen
  names(sindex) <- 1:slen

  index <- c(sindex, lindex)
  index <- index[order(names(index))]

  return(c(a, b)[index])

}
Run Code Online (Sandbox Code Playgroud)