Suy*_*ash 7 php algorithm math statistics
当我有一个带有N个样本大小的选择的图像时,我应该使用什么mean-stat-equation?
我有一个独特的问题,我希望得到一些建议,这样我就不会错过任何事情.问题:基于用户选择不同选择比的区域,在图像上找到最喜欢/喜欢/重要的区域.
场景:考虑一只狗的图像,以及数百名用户以各种分辨率选择该图像上的区域,大多数选择中明显的焦点区域将是包含狗的区域.我可以记录x1,x2,y1,y2坐标并将它们放入数据库,现在如果我想在一组分辨率中自动生成此图像的版本,我应该能够识别具有最大吸引力的区域用户.我认为可行的方法是:
期待我的问题的一些出色的解决方案
有关该问题的更多信息:实际图像很可能是1024x768图像,并且对其进行的选择将是最常见的移动电话分辨率.目标是根据用户选择通过智能学习自动生成手机壁纸.
我相信您有上面提到的两个不同的问题:
一:点的识别
为此,您需要开发某种启发式方法来确定是否应该考虑某个点。
我相信您提到过数百个用户将在此图像上选择位置?数百个可能是很多要聚类的点。考虑排除异常值(通过删除在特定距离内没有一定数量邻居的点)
任何可以减少数据集的事情都会有所帮助。
二:点的聚类
我相信 K 均值聚类最适合这个特定问题。 关联
您的特定问题似乎密切反映了用于解释该算法的标准笛卡尔坐标聚类示例。
您尝试做的事情似乎是 NP-Hard,但应该通过经典近似来满足。
聚类后,您可以对该聚类内的点取平均值,以获得相当准确的近似值。
此外:
您的数据集听起来像是已经紧密聚集在一起。(即大多数人会选择狗的脸,而不是它躯干的侧面。)您需要了解局部最小值。LINK这些确实会给你的算法带来麻烦。尤其是对于少量集群。请注意,您可能需要一些动态编程来解决这个问题。您通常可以在算法中引入一些方差,允许平均点从这些局部最小值中“弹出”。局部最小值/最大值
希望这可以帮助!