使用R tm,我有一个术语doc矩阵:
文档术语矩阵(16977术语,29414文档)
非稀疏条目:355000/499006478稀疏度:100%最大术语长度:7加权:术语频率(tf)
为了进一步分析,我必须将术语数限制为2425.
如何通过在例如20以上的频率中包含freq来生成新的dtm?
由于矩阵很大,传统的方法as.matrix不能应用.
谢谢!
r text-mining sparse-matrix bigdata tm
bigdata ×1
r ×1
sparse-matrix ×1
text-mining ×1
tm ×1