pns*_*lva 3 nlp cluster-analysis machine-learning data-mining
我正在使用k-means聚类来分组一组新闻.我使用词袋模型来表示文档,更具体地说,每个文档都表示为术语频率向量.
我的问题:如何在不重新计算所有术语频率向量的情况下添加新文档(看到包含所有文档的所有术语的词汇表都会发生变化)?
归档时间: |
|
查看次数: |
402 次 |
最近记录: |