什么是特征向量比较的良好指标以及如何在比较之前对它们进行标准化?

cde*_*roy 6 machine-learning computer-vision image-segmentation

背景:

我正在研究一种自下而上的图像分割方法,其中我首先将图像过度分割为小区域/超像素/超体素,然后我想基于某些标准迭代地合并相邻的过分割区域.我一直在玩的一个标准是测量这两个区域在外观上的相似程度.为了量化一个区域的外观,我使用了几种方法 - 强度统计,纹理特征等.我将我为一个区域计算的所有特征都集成到一个长特征向量中.

题:

给定两个相邻的过分割区域R1和R2,让F1和F2为对应的特征向量.我的问题如下:

- 量化F1和F2之间相似性的好指标是什么?

- 在量化与度量的相似性之前,如何最好地标准化F1和F2?(使用任何监督的规范化方法都是不可行的,因为我不希望我的算法被绑定到一组图像)

我心中的解决方案:

相似度(R1,R2)= dot_product(F1/norm(F1),F2/norm(F2))

换句话说,我首先将F1和F2归一化为单位向量,然后使用两个向量之间的点积作为相似性度量.

我想知道是否有更好的方法来规范化它们并将它们与指标进行比较.如果社区可以指出一些参考文献并写出为什么其他东西比我正在使用的相似性度量更好的原因,我会很高兴.

san*_*dyp 0

只是想指出,在计算余弦相似度(即点积)之前,您实际上并不需要从 F1 或 F2 创建单位向量。这是因为 F1/norm(F1) 会显式地使每个向量成为用于方向比较的单位向量。

用于矢量比较的其他度量包括欧几里德距离、曼哈顿距离或马哈拉诺比斯距离。最后一种可能不太适用于您的场景。请阅读维基百科了解更多信息。

我自己也曾多次争论过欧几里得和余弦哪个更好。请注意,任一指标的使用背景都是主观的。如果在欧几里得空间中,您只想测量两个点是否对齐在一起,则余弦测量有意义。如果你想要明确的距离度量,欧几里德是更好的。