小编Yan*_*ngJ的帖子

R tm:巨大的DocumentTermMatrix,如何设置术语频率绑定以提取新的DTM

使用R tm,我有一个术语doc矩阵:

文档术语矩阵(16977术语,29414文档)

非稀疏条目:355000/499006478稀疏度:100%最大术语长度:7加权:术语频率(tf)

为了进一步分析,我必须将术语数限制为2425.

如何通过在例如20以上的频率中包含freq来生成新的dtm?

由于矩阵很大,传统的方法as.matrix不能应用.

谢谢!

r text-mining sparse-matrix bigdata tm

3
推荐指数
1
解决办法
3702
查看次数

标签 统计

bigdata ×1

r ×1

sparse-matrix ×1

text-mining ×1

tm ×1