R文本挖掘包:允许将新文档合并到现有语料库中

Shi*_*Rao 6 text r text-mining

我想知道R的文本挖掘包是否有任何机会具有以下功能:

myCorpus <- Corpus(DirSource(<directory-contatining-textfiles>),control=...)
# add docs
myCorpus.addDocs(DirSource(<new-dir>),control=...)
Run Code Online (Sandbox Code Playgroud)

理想情况下,我想将其他文档合并到现有语料库中.

任何帮助表示赞赏

Hen*_*nry 11

您应该能够只使用c(,)

> library(tm)
> data("acq")
> data("crude")
> together <- c(acq,crude)
> acq
A corpus with 50 text documents
> crude
A corpus with 20 text documents
> together
A corpus with 70 text documents
Run Code Online (Sandbox Code Playgroud)

你可以找到更多的在TM包文档tm_combine.