使用 K-means 聚类生成锚框，YOLO

yin*_*ang 3 bounding-box object-detection computer-vision k-means yolo

我试图了解 YOLO 的工作原理以及它如何检测图像中的对象。我的问题是，k-means 聚类在检测对象周围的边界框方面起什么作用？谢谢。

K均值聚类算法是数据科学中非常著名的算法。该算法旨在将n观察划分为k集群。主要包括：

初始化：K意味着（即质心）是随机生成的。
作业：通过将每个观测值与最近的质心相关联来形成聚类。
更新集群：新创建的集群的质心变为平均值。

分配和更新重复发生直到收敛。最终结果是点和它们各自的质心之间的平方误差总和被最小化。

编辑：

为什么用K方式

与其他无监督学习算法相比，K-means 的计算速度更快、效率更高。不要忘记时间复杂度是线性的。
它产生比层次聚类更高的聚类。更多数量的集群有助于获得更准确的最终结果。
重新计算质心时，实例可以更改集群（移动到另一个集群）。
即使您的某些假设被打破，它也能很好地工作。

它在确定锚框方面的真正作用

它将为每个代表形状、位置、大小等的预测器创建数千个锚框（即 k 均值中的集群）。
对于每个锚框，计算哪个对象的边界框具有最高重叠除以非重叠。这称为联合交叉或 IOU。
如果最高IOU大于50%（这个可以自定义），告诉anchor box检测IOU最高的物体。
否则如果 IOU 大于 40%，告诉神经网络真正的检测是不明确的，不要从那个例子中学习。
如果最高IOU小于40%，那么应该预测没有对象。

谢谢！

归档时间：	6 年，6 月前
查看次数：	4888 次
最近记录：	5 年，3 月前

OpenCV:查找二进制Mat图像的所有非零坐标 19

如何在图像中找到对齐标记 12

从直方图曲线中选择最佳值范围 7

图像上的人脸对齐算法 6

霍夫变换中的负 rho 值如何处理？ 5

TensorFlow 对象检测 API：指定多个 data_augmentation_options 5

pytorch如何通过argmax反向传递？ 5

对于给定的旋转，旋转矩阵是否唯一？ 3

Tensorflow检测API中的SSD锚点 3

纹理的要点究竟意味着什么？ 2

如何将新的本地分支推送到远程Git存储库并跟踪它？ 4154

为什么在C++中读取stdin的行比Python要慢得多？ 1738

你如何改变用matplotlib绘制的数字的大小？ 1726

Bower和npm有什么区别？ 1723

如何在Git中完全替换另一个分支中的master分支？ 1549

.gitignore被Git忽略了 1407

如何自动调整图像大小以适合div容器 1394

静态只读与const 1349

如何使用jQuery按名称选择元素？ 1160

群集和非群集索引实际上意味着什么？ 1041