Ell*_* JJ 3 graphics computer-vision object-recognition 3d-reconstruction
直观地说,似乎从几乎任何物体的不同角度给出十几个2D图像,应该很容易构造该对象的三维表示.随后,以这种方式获得的3d表示库可用于识别新的2d图像.
沿着这些方向有哪些文献,为什么它还没有产生强烈的物体识别?
这是你的"直觉"这个词,它会给你带来麻烦.你的大脑并不是设计得非常擅长某些任务,比如瞬间成倍增加数千个数字.然而,对于原始的计算能力,你的大脑使得最快的计算机看起来像仅仅是眨眼(神经响应时间只有大约10毫秒,但所有那些10 ^ 14左右的神经元都并行工作完全胜过任何现代机器).只是你的大脑被设计用来解决计算复杂程度更高的问题,例如识别图片中的对象,解析声音数据以及在背景噪声中挑选出单个扬声器.学习分类和处理成千上万种类型的对象.
你的大脑设计得非常好的计算强度非常高的东西,对于一个人来说,似乎是"直观的".它没有被设计成真正做的事情似乎"不直观"或困难.但强对象识别所需的原始计算(因为有很多种类的对象,其中许多实际上有子对象,多种分类,以及非刚性形式,例如"裤子","水","狗")比计算机所能完成的事情要多得多.使用"常识"来解决日常问题对于一个人而言同样微不足道,但计算上非常复杂.