可能重复:
最佳地聚类一维数据?
所以,假设我有一个这样的数组:
[1,1,2,3,10,11,13,67,71]
Run Code Online (Sandbox Code Playgroud)
有没有一种方便的方法将数组分区为这样的东西?
[[1,1,2,3],[10,11,13],[67,71]]
Run Code Online (Sandbox Code Playgroud)
我查看了类似的问题,但是大多数人建议使用k-means来聚集点,比如scipy,这对像我这样的初学者来说非常混乱.另外我认为k-means更适合两维或更多维聚类吧?有没有办法根据数字将N个数组分组到多个分区/聚类?
有些人还提出了严格的范围分区,但并不总是按预期呈现结果
arrays cluster-analysis data-mining dimension partition-problem
有没有人有一篇论文解释了Ckmeans.1d.dp算法是如何工作的?
或者:在一维中进行k均值聚类的最佳方法是什么?
我有一个像这样的一维列表
public class Zeit_und_Eigenschaft
{
[Feature]
public double Sekunden { get; set; }
}
//...
List<Zeit_und_Eigenschaft> lzue = new List<Zeit_und_Eigenschaft>();
//fill lzue
Run Code Online (Sandbox Code Playgroud)
lzue可以
lzue.Sekunden
1
2
3
4
8
9
10
22
55
...
Run Code Online (Sandbox Code Playgroud)
目标是在该列表中找到群集,即在此示例中可以形成像fi这样的群组的元素
lzue.Sekunden
1
2
3
4
8
9
10
22
55
Run Code Online (Sandbox Code Playgroud)
哪种聚类算法是合适的(我不知道聚类数k)?GMM?PCA?K均值?其他?
我有一个数组列表中的数字.每个元素的索引是X,值是Y.我如何分区/聚类这些数据?如果我有一个数组,我只想要一组标记每个分区结束的值.由于我正在使用Python,请提及是否有库可以执行相同操作.
谢谢.
可能的重复:
一维数字数组聚类
我有一个数字数组,例如[1, 20, 300, 45, 5, 60, 10, 270, 3]. 根据邻近度将这些数字分组在一起的有效算法是什么?在这种情况下,我期望类似[1, 3, 5],[20, 45, 60]和 的东西[270, 300]。
language-agnostic algorithm math statistics cluster-analysis