K均值聚类和矢量量化之间的区别?

gar*_*rak 7 machine-learning computer-vision hidden-markov-models

K-Means聚类和矢量量化之间有什么区别?他们似乎非常相似.

我正在处理隐马尔可夫模型,我需要从特征向量中提取符号.

为了提取符号,我是做矢量量化还是Kmeans聚类?

Rob*_*aus 15

我理解它的方式,K-means是一种矢量量化.

  • 确切地。K 均值聚类是执行矢量量化的一种方法。通过 K 均值找到的质心是(使用信息论术语)您的*代码本*的*符号*或*代码字*。要解码向量,请将向量分配给最接近的质心(或码字)。 (2认同)

小智 5

K均值算法是着名的"Lloyd I"量化算法对经验分布情况的特化.(比照劳埃德)

证明Lloyd I算法产生具有递减的二次失真的量化器序列.然而,除了一维对数 - 凹分布的特殊情况外,它并不总是收敛于二次最优量化器.(量化误差存在局部最小值,特别是在处理经验分布时,即对于聚类问题.)

将(总是)收敛到最佳量化器的方法是所谓的CLVQ算法,其也推广到更一般的L ^ p量化的问题.它是一种随机梯度法.(参见Pagès)

还有一些基于遗传算法的方法.(参见Hamida等人),和/或用于更快收敛的一维情况的经典优化程序(Pagès,Printems).