Kar*_*thi 5 java
我需要在java中使用k-means算法执行文档聚类的步骤.对我来说,轻松提供这些步骤非常有用.提前致谢.
ikl*_*ine 0
您想基于什么对文档进行聚类?如果是通过相似性,您需要首先进行一些自然语言处理,然后您需要一个度量(某种分配算法)将文档放入集群中(crp 可以工作并且相对简单)。
如果你不根据“长度”之类的东西对它们进行聚类,那么最难的部分将是 NLP(语言处理)。我可以提供有关所有这些的更多信息,但如果您不需要,我不会深入研究。
归档时间:
15 年,3 月 前
查看次数:
8414 次
最近记录:
13 年,8 月 前