该tm包扩展c,使得如果给定一组PlainTextDocument的IT自动创建Corpus.不幸的是,似乎每个都PlainTextDocument必须单独指定.
例如,如果我有:
foolist <- list(a, b, c); # where a,b,c are PlainTextDocument objects
Run Code Online (Sandbox Code Playgroud)
我这样做是为了得到一个Corpus:
foocorpus <- c(foolist[[1]], foolist[[2]], foolist[[3]]);
Run Code Online (Sandbox Code Playgroud)
我有一个列表的列表'PlainTextDocument,看起来像这样:
> str(sectioned)
List of 154
$ :List of 6
..$ :Classes 'PlainTextDocument', 'TextDocument', 'character' atomic [1:1] Developing assessment models Developing models
.. .. ..- attr(*, "Author")= chr "John Smith"
.. .. ..- attr(*, "DateTimeStamp")= POSIXlt[1:1], format: "2013-04-30 12:03:49"
.. .. ..- attr(*, "Description")= chr(0)
.. .. …Run Code Online (Sandbox Code Playgroud) 我有一个列表列表,称之为listHolder长度为5的列表.
每个元素listHolder都是一个数字数据列表,包含160个左右的元素.
我需要将这个列表列表转换data.frame为长度为5 的列表,每个元素都是一个包含160个左右元素的数字向量.
但是我尝试过的一切,从遍历列表列表并将每个元素as.numeric(unlist(listHolder[[i]]))转换为
data.frame(matrix(unlist(listHolder), nrow = length(totalKeywords), byrow = T))
Run Code Online (Sandbox Code Playgroud)
最终创建一个长度为160左右的数据帧,每个元素都是一个带有5个左右元素的数字向量.
我该怎么做我想要的?
尝试data.frame(matrix(unlist(totalKeywords), nrow=132, byrow=T))产生与我想要的相反 - 每个5个元素长的160个小项目.