我想知道其他人正在做什么与K-means集群订购.我正在制作热图(主要是ChIP-Seq数据),并使用自定义热图功能(基于R的内置热图功能)获得漂亮的数字.但是,我想要两个改进.第一种是根据平均值递减来订购我的集群.例如,以下代码:
fit = kmeans(data, 8, iter.max=50, nstart=10)
d = data.frame(data, symbol)
d = data.frame(d, fit$cluster)
d = d[order(d$fit.cluster),]
Run Code Online (Sandbox Code Playgroud)
给我一个在簇列上排序的data.frame.订购行的最佳方法是什么,以便8个集群按其各自的方式排序?
其次,您是否建议将每个群集中的行从最高平均值排序到最低?这将对数据进行更有条理的观察,但可能会欺骗一个非谨慎的观察者来推断他可能不应该做的事情.如果你的确推荐这个,你会如何最有效地做到这一点?
r ×1