In storage.mode(x) <- "double" :在 kmeans 中通过强制转换引入的 NA

Sri*_*han 3 r data-mining

我正在尝试将数据分成 5 个集群。但我收到以下错误

> colSums(sapply(train1,is.na))
     train_id              name item_condition_id     category_name 
            0                 0                 0                 0 
   brand_name             price          shipping  item_description 
            0                 0                 0                 0 
> train1matrix=as.matrix(train1)
> train1vector=as.vector(train1matrix)
> k=5
> set.seed(88)
> KMC=kmeans(train1vector,centers=k,iter.max=1000)
Error in do_one(nmeth) : NA/NaN/Inf in foreign function call (arg 1)
In addition: Warning message:
In storage.mode(x) <- "double" : NAs introduced by coercion
Run Code Online (Sandbox Code Playgroud)

有人可以帮帮我吗?先感谢您

Ano*_*sse 5

kmeans只能用于数值列,因为它需要计算平均值

不要在“ID”列、文本列等上使用它,因为计算平均值没有意义。看来您正在尝试在此类“坏”列上运行 kmeans。