小编mov*_*out的帖子

k-意味着在非常大的稀疏矩阵上聚类?

我试图在一个非常大的矩阵上做一些k-means聚类.

矩阵大约是500000行×4000个cols但非常稀疏(每行只有几个"1"值).

整件事不适合内存,因此我将其转换为稀疏的ARFF文件.但是R显然无法读取稀疏的ARFF文件格式.我还将数据作为普通的CSV文件.

R中是否有可用于有效加载此类稀疏矩阵的包?然后,我将使用群集包中的常规k-means算法继续.

非常感谢

r cluster-analysis sparse-matrix

9
推荐指数
1
解决办法
5920
查看次数

标签 统计

cluster-analysis ×1

r ×1

sparse-matrix ×1