绘图和绘画机器人的算法 - 任何提示?

com*_*eye 9 robotics artificial-intelligence image-processing computer-vision

绘图和绘画机器人的算法 -

你好

我想编写一个分析图像的软件,然后使用最少的不同颜色和不透明度的bezier路径对象生成一个图像,该图像捕获人眼在原始图像中感知的内容.

与最近的推特超级压缩比赛(参见:stackoverflow.com/questions/891643/twitter-image-encoding-challenge)不同,我的目标不是创建一个忠实于图像的复制品,而是复制人类的体验.看着这个形象.

例如,如果原始图像在左上角显示一个红色气球,并且再现在左上角看起来像一个红色气球,那么我将实现我的目标,即使再现中的气球是不是在相同的位置,并没有完全相同的大小或颜色.

当我说"被人类感知"时,我的意思是非常有限.我不是试图分析图像的意义,我不需要知道图像是什么,我只对人眼会注意到的关键视觉特征感兴趣,只要这可以通过算法无法概念化实际观察的内容.

为什么这种不同的人类感知标准超过了摄影的准确性?

该软件将用于驱动绘画机器人,它会与人的艺术家进行合作(见:video.google.com/videosearch?q=mr%20squiggle).

算法应该寻求将画布上已经存在的内容合并到最终图像中,而不是将人类制作的标记视为不完美的错误.

因此,相对亮度,色调,饱和度,大小和位置比照片上与原始相同更重要.保持特征的拓扑结构,颜色块,渐变,凸凹曲线对于这些特征的确切尺寸形状和颜色将更为重要

还在我这儿?

我的问题是,我从"当你有一把锤子看起来像钉子"综合症时会受到一点点痛苦.对我来说,似乎这样做的方法是使用遗传算法的东西,如小波变换的比较(见:grail.cs.washington.edu/projects/query/)由retrievr使用(参见:labs.systemone.at/ retrievevr /)选择合适的解决方案.

但我认为这是答案的主要原因是,这些是我所知道的技术,可能有更优雅的解决方案使用我现在没有任何关于的技术.

考虑到人类视觉系统分析图像的方式会特别有趣,因此可能需要特别注意直线,角度,高对比度边框和相似颜色的大块.

您对视觉,图像算法,遗传算法或类似项目应该阅读的内容有什么建议吗?

谢谢

PS.上面的一些拼写可能对你和你的拼写检查有误.这只是国际拼写变化,可能与您所在国家/地区的标准不同:例如澳大利亚标准:颜色与美国标准:颜色

Jan*_*usz 3

有一种模型可以作为计算图像显着性图的算法来实现,从而确定图像的哪些部分最能引起人类的关注。

该模型称为 itti koch 模型您可以在此处
找到起始论文 以及更多资源和 c++ 源代码此处