小编Sri*_*han的帖子

In storage.mode(x) <- "double" :在 kmeans 中通过强制转换引入的 NA

我正在尝试将数据分成 5 个集群。但我收到以下错误

> colSums(sapply(train1,is.na))
     train_id              name item_condition_id     category_name 
            0                 0                 0                 0 
   brand_name             price          shipping  item_description 
            0                 0                 0                 0 
> train1matrix=as.matrix(train1)
> train1vector=as.vector(train1matrix)
> k=5
> set.seed(88)
> KMC=kmeans(train1vector,centers=k,iter.max=1000)
Error in do_one(nmeth) : NA/NaN/Inf in foreign function call (arg 1)
In addition: Warning message:
In storage.mode(x) <- "double" : NAs introduced by coercion
Run Code Online (Sandbox Code Playgroud)

有人可以帮帮我吗?先感谢您

r data-mining

3
推荐指数
1
解决办法
3万
查看次数

如何在 R 中处理大量数据并构建模型

我一直在尝试为包含 7000 万条记录的数据集构建模型R。我尝试了所有可能的选项来构建模型,例如clustering使用ffh2o(这会引发我的错误)bigmemorybiganalytics包。使用R我尝试过的选项,我无法处理如此庞大的数据。

您能否建议我除此之外的任何工作选项,以便我可以使用它来构建模型。我的笔记本电脑是 4GB RAM 和 64 位处理器。

r h2o r-bigmemory

1
推荐指数
1
解决办法
1212
查看次数

标签 统计

r ×2

data-mining ×1

h2o ×1

r-bigmemory ×1