小编13I*_*rge的帖子

向集群添加标签

我是 R 新手,正在尝试根据行业对一些数据进行聚类。我了解到 K 均值无法处理因子和分类数据。我已经从我的数据集中删除了名为“行业”的因素(67 个不同的观察结果),但希望在模型完成后为每个观察结果分配一个标签。本质上,我希望我的最终结果看起来像美国犯罪数据集示例。任何帮助将不胜感激。

我的结果:

在此输入图像描述

我理想的结果:

在此输入图像描述

代码:

library(tidyverse) # data manipulation
library(cluster) # clustering algorithms
library(factoextra) # clustering algorithms & visualization
library(ggplot2) ## used for plotting
library(gridExtra) ## used for plotting
library(robustbase)

###Read in dataset
df <- read.csv('my_data')
df2 <- scale(df)

### Subset of Data -- looking at percentage closed won and total opportunities
dat = df2[,c(1,3)]

# initial cluster split
k2 <- kmeans(dat, centers = 2, nstart = 25)
str(k2)
k2
fviz_cluster(k2, data = dat)

### Additional …
Run Code Online (Sandbox Code Playgroud)

r cluster-analysis k-means factoextra

6
推荐指数
1
解决办法
9304
查看次数

标签 统计

cluster-analysis ×1

factoextra ×1

k-means ×1

r ×1