小编use*_*599的帖子

从R中的Document-Term-Matrix过滤行/文档

在RI中使用tm-package创建一个Document-Term-Matrix:

dtm <- DocumentTermMatrix(cor, control = list(dictionary=c("someTerm")))

Run Code Online (Sandbox Code Playgroud)

哪个结果是这样的:

A document-term matrix (291 documents, 1 terms)

Non-/sparse entries: 48/243
Sparsity           : 84%
Maximal term length: 8 
Weighting          : term frequency (tf) 

                   Terms
Docs                someTerm
doc1                       0
doc2                       0
doc3                       7
doc4                       22
doc5                       0

Run Code Online (Sandbox Code Playgroud)

现在我想根据文档中someTerm的出现次数过滤这个Document-Term-Matrix.例如,仅过滤someTerm至少出现一次的文档.即doc3和doc4.

我怎样才能做到这一点？

r matrix text-mining tm

use*_*599

2017 10-17

6
推荐指数

1
解决办法

6128
查看次数