我正在学习python scikit。此处给出的示例显示每个群集中出现次数最高的单词,而不显示群集名称。
http://scikit-learn.org/stable/auto_examples/document_clustering.html
我发现km对象具有“ km.label”,其中列出了质心ID,即数字。
我有两个问题
1. How do I generate the cluster labels?
2. How to identify the members of the clusters for further processing.
Run Code Online (Sandbox Code Playgroud)
我具有k均值的工作知识,并且了解tf-ids概念。
python cluster-analysis machine-learning k-means scikit-learn