mov*_*out 9 r cluster-analysis sparse-matrix
我试图在一个非常大的矩阵上做一些k-means聚类.
矩阵大约是500000行×4000个cols但非常稀疏(每行只有几个"1"值).
整件事不适合内存,因此我将其转换为稀疏的ARFF文件.但是R显然无法读取稀疏的ARFF文件格式.我还将数据作为普通的CSV文件.
R中是否有可用于有效加载此类稀疏矩阵的包?然后,我将使用群集包中的常规k-means算法继续.
非常感谢
Dir*_*tel 13
该bigmemory包(或现在家庭套餐的-看到自己的网站)使用K-手段对大型数据运行例如扩展分析的.特别参见包含k-means函数的子包biganalytics.
归档时间:
15 年,2 月 前
查看次数:
5920 次
最近记录:
10 年,3 月 前