我试图在一个非常大的矩阵上做一些k-means聚类.
矩阵大约是500000行×4000个cols但非常稀疏(每行只有几个"1"值).
整件事不适合内存,因此我将其转换为稀疏的ARFF文件.但是R显然无法读取稀疏的ARFF文件格式.我还将数据作为普通的CSV文件.
R中是否有可用于有效加载此类稀疏矩阵的包?然后,我将使用群集包中的常规k-means算法继续.
非常感谢
r cluster-analysis sparse-matrix
cluster-analysis ×1
r ×1
sparse-matrix ×1