如何压扁列表列表?

dna*_*irl 64 r list tm

tm包扩展c,使得如果给定一组PlainTextDocument的IT自动创建Corpus.不幸的是,似乎每个都PlainTextDocument必须单独指定.

例如,如果我有:

foolist <- list(a, b, c); # where a,b,c are PlainTextDocument objects
Run Code Online (Sandbox Code Playgroud)

我这样做是为了得到一个Corpus:

foocorpus <- c(foolist[[1]], foolist[[2]], foolist[[3]]);
Run Code Online (Sandbox Code Playgroud)

我有一个列表的列表'PlainTextDocument,看起来像这样:

> str(sectioned)
List of 154
 $ :List of 6
  ..$ :Classes 'PlainTextDocument', 'TextDocument', 'character'  atomic [1:1] Developing assessment models   Developing models
  .. .. ..- attr(*, "Author")= chr "John Smith"
  .. .. ..- attr(*, "DateTimeStamp")= POSIXlt[1:1], format: "2013-04-30 12:03:49"
  .. .. ..- attr(*, "Description")= chr(0) 
  .. .. ..- attr(*, "Heading")= chr "Research Focus"
  .. .. ..- attr(*, "ID")= chr(0) 
  .. .. ..- attr(*, "Language")= chr(0) 
  .. .. ..- attr(*, "LocalMetaData")=List of 4
  .. .. .. ..$ foo           : chr "bar"
  .. .. .. ..$ classification: chr "Technician"
  .. .. .. ..$ team          : chr ""
  .. .. .. ..$ supervisor    : chr "Bill Jones"
  .. .. ..- attr(*, "Origin")= chr "Smith-John_e.txt"

#etc., all sublists have 6 elements
Run Code Online (Sandbox Code Playgroud)

所以,为了让我PlainTextDocument的所有s成为一个Corpus,这将工作:

sectioned.Corpus <- c(sectioned[[1]][[1]], sectioned[[1]][[2]], ..., sectioned[[154]][[6]])
Run Code Online (Sandbox Code Playgroud)

有人可以建议一个更简单的方法吗?

ETA:foo<-unlist(foolist, recursive=FALSE)生成一个PlainTextDocuments的平面列表,这仍然让我遇到按元素提供列表元素的问题c

DrD*_*Dom 63

我希望这unlist(foolist)会对你有所帮助.它有一个选项recursiveTRUE默认.

那么unlist(foolist, recursive = FALSE)将返回文档列表,然后您可以通过以下方式将它们组合:

do.call(c, unlist(foolist, recursive=FALSE))
Run Code Online (Sandbox Code Playgroud)

do.call只是将函数应用于c获得列表的元素


Mic*_*ael 21

这是一个更通用的解决方案,用于何时多次嵌套列表,并且列表元素之间的嵌套量不同:

 flattenlist <- function(x){  
  morelists <- sapply(x, function(xprime) class(xprime)[1]=="list")
  out <- c(x[!morelists], unlist(x[morelists], recursive=FALSE))
  if(sum(morelists)){ 
    Recall(out)
  }else{
    return(out)
  }
}
Run Code Online (Sandbox Code Playgroud)

  • 只是为了使它更易于理解,我只是指出,当嵌套对象属于继承类时,使用class(xprime)[1] ==“ list”)标识列表是必要的(而不是使用is.list)来自列表(即请注意is.list(data.frame(3))的计算结果为TRUE) (3认同)
  • 还请注意,这不会保留原始结构的顺序 (2认同)
  • 非常有用:我的用例是“map(some_nested_list, flattenlist)%&gt;%bind_rows()”来生成一个小标题。 (2认同)

Zeu*_*eus 6

这是另一种适用于我的列表列表的方法。

df <- as.data.frame(do.call(rbind, lapply(foolist, as.data.frame)))

或者看看 tidyr 中运行良好的新功能。

将嵌套列表矩形化为整洁的小标题

矩形

    lst <-  list(
      list(
        age = 23,
        gender = "Male",
        city = "Sydney"
      ),
      list(
        age = 21,
        gender = "Female",
        city = "Cairns"
      )
    )
      
    tib <- tibble(lst)  %>% 
      unnest_wider(lst)

df <- as.data.frame(tib)
Run Code Online (Sandbox Code Playgroud)