k-意味着在非常大的稀疏矩阵上聚类?

mov*_*out 9 r cluster-analysis sparse-matrix

我试图在一个非常大的矩阵上做一些k-means聚类.

矩阵大约是500000行×4000个cols但非常稀疏(每行只有几个"1"值).

整件事不适合内存,因此我将其转换为稀疏的ARFF文件.但是R显然无法读取稀疏的ARFF文件格式.我还将数据作为普通的CSV文件.

R中是否有可用于有效加载此类稀疏矩阵的包?然后,我将使用群集包中的常规k-means算法继续.

非常感谢

Dir*_*tel 13

bigmemory包(或现在家庭套餐的-看到自己的网站)使用K-手段对大型数据运行例如扩展分析的.特别参见包含k-means函数的子包biganalytics.