该tm包扩展c,使得如果给定一组PlainTextDocument的IT自动创建Corpus.不幸的是,似乎每个都PlainTextDocument必须单独指定.
例如,如果我有:
foolist <- list(a, b, c); # where a,b,c are PlainTextDocument objects
Run Code Online (Sandbox Code Playgroud)
我这样做是为了得到一个Corpus:
foocorpus <- c(foolist[[1]], foolist[[2]], foolist[[3]]);
Run Code Online (Sandbox Code Playgroud)
我有一个列表的列表'PlainTextDocument,看起来像这样:
> str(sectioned)
List of 154
$ :List of 6
..$ :Classes 'PlainTextDocument', 'TextDocument', 'character' atomic [1:1] Developing assessment models Developing models
.. .. ..- attr(*, "Author")= chr "John Smith"
.. .. ..- attr(*, "DateTimeStamp")= POSIXlt[1:1], format: "2013-04-30 12:03:49"
.. .. ..- attr(*, "Description")= chr(0)
.. .. …Run Code Online (Sandbox Code Playgroud) A = data.frame( a = c(1:10), b = c(11:20) )
B = data.frame( a = c(101:110), b = c(111:120) )
C = data.frame( a = c(5:8), b = c(55:58) )
L = list(list(B,C),list(A),list(C,A),list(A,B,C),list(C))
Run Code Online (Sandbox Code Playgroud)
我有一个数据框列表列表,但我必须创建一个所有数据框的列表,如下所示(数据框的顺序在L和New L中保持相同)
NewL = list( B,C,A,C,A,A,B,C,C )
Run Code Online (Sandbox Code Playgroud) 考虑这个数据帧的嵌套列表:
df <- data.frame(x = 1:5, y = letters[1:5])
l <- list(df, list(df, df), list(df, list(df, df, list(df))), list(df), df)
Run Code Online (Sandbox Code Playgroud)
如何从这个深度嵌套的列表得到一个简单的数据帧列表:
list(df, df, df, df, df, df, df, df, df)
Run Code Online (Sandbox Code Playgroud)
通常的解决方案(如此处)无法保留数据帧的结构。