我正在尝试将数据分成 5 个集群。但我收到以下错误
> colSums(sapply(train1,is.na))
train_id name item_condition_id category_name
0 0 0 0
brand_name price shipping item_description
0 0 0 0
> train1matrix=as.matrix(train1)
> train1vector=as.vector(train1matrix)
> k=5
> set.seed(88)
> KMC=kmeans(train1vector,centers=k,iter.max=1000)
Error in do_one(nmeth) : NA/NaN/Inf in foreign function call (arg 1)
In addition: Warning message:
In storage.mode(x) <- "double" : NAs introduced by coercion
Run Code Online (Sandbox Code Playgroud)
有人可以帮帮我吗?先感谢您
我一直在尝试为包含 7000 万条记录的数据集构建模型R。我尝试了所有可能的选项来构建模型,例如clustering使用ff库h2o(这会引发我的错误)bigmemory和biganalytics包。使用R我尝试过的选项,我无法处理如此庞大的数据。
您能否建议我除此之外的任何工作选项,以便我可以使用它来构建模型。我的笔记本电脑是 4GB RAM 和 64 位处理器。