dro*_*ops 4 visualization r data-visualization cluster-analysis dbscan
非常感谢您的意见,建议或解决方案,谢谢.
我正在使用fpcR中的软件包对一些非常密集的数据进行dbscan分析(范围-3,6之间的3组40,000个点).
我找到了一些集群,我需要只绘制重要的集群.问题是我有一个集群(第一个),其中有大约39,000个点.我需要绘制所有其他集群的图表,但这一个.
将dbscan()创建一个特殊的数据类型来存储所有在该集群数据.这不是像索引数据帧将是(但也许有其代表作为这样一种方式?).
我可以使用基本plot()调用来绘制dbscan类型.但是,就像我说的那样,这将描绘出无关紧要的39,000点.
tl; dr:我如何仅绘制dbscan数据类型的特定聚类?
如果查看帮助页面(?dbscan),它会像所有其他页面一样组织成标记为"描述","用法","参数","详细信息"和"值"的部分."值"部分描述了函数dbscan返回的内容.在这种情况下,它只是一个包含少量组件的列表(标准R数据类型).
该cluster组件只是一个整数向量,其长度等于数据中的行数,表示每个观察所属的成员.因此,您可以使用此向量对数据进行子集化,以仅提取您想要的那些群集,然后仅绘制这些数据点.
例如,如果我们使用帮助页面中的第一个示例:
set.seed(665544)
n <- 600
x <- cbind(runif(10, 0, 10)+rnorm(n, sd=0.2), runif(10, 0, 10)+rnorm(n,
sd=0.2))
ds <- dbscan(x, 0.2)
Run Code Online (Sandbox Code Playgroud)
然后我们可以使用结果,ds仅绘制簇1-3中的点:
#Plot only clusters 1, 2 and 3
plot(x[ds$cluster %in% 1:3,])
Run Code Online (Sandbox Code Playgroud)