用于3D重建的图切割算法的类型

Max*_*lan 3 image-processing computer-vision 3d-reconstruction

我已经阅读了几篇关于使用图形切割进行3D重建的论文,我注意到似乎有两种替代方法来解决这个问题.

一种方法是体积并描述体素的3D区域,其中使用图形切割来推断每个体素的二元标记(包含感兴趣的对象或不包含对象).采用这种方法的论文包括通过体积图切割的多视图立体声和遮挡强大的照片一致性以及使用全局图切割优化的表面重建.

第二种方法是2D,并试图用投影在那里的3D点的深度标记参考图像的每个像素.采用这种方法的论文包括通过图形切割计算视觉对应与遮挡.

我想了解每种方法的优点/缺点,以及在选择使用哪种方法时最重要的方法.到目前为止,我了解第一种方法的一些优点是:

  1. 这是一个二元问题,因此可以使用Max-Flow算法进行精确求解.
  2. 提供简单的遮挡建模方法.

第二种方法的一些优点是:

  1. 为图的每个节点设置较小的邻居.
  2. 更容易建模平滑度(但是它会给出更好的结果吗?).

另外,我会对哪种情况我最好选择一种表示或另一种表示以及为什么感兴趣.

DCS*_*DCS 5

最重要的区别是算法通常使用的场景类型,以及它们表示对象的3D形状方式.

体积方法表现最佳......

  1. 有大量的图像......
  2. 取自不同的观点,分布在对象周围,......
  3. 或多或少紧凑的"物体"(例如,人工制品,相反,例如,由车辆摄像机观察到的室外场景).

体积方法很受欢迎,用于重建"对象"(尤其是伪像).给定足够的视图(即图像),算法给出对象形状的完整体积(即体素)表示.可以使用Marching Cubes或类似方法将其转换为曲面表示.

您识别的第二种算法称为立体算法,图形切割只是解决此类问题的众多方法之一.立体声最好......

  1. 如果你只有两张图片......
  2. 基线相当窄(即相机之间的距离)

存在对两个以上图像(具有窄基线)的推广,但是大多数文献涉及双目(即两个图像)情况.有些算法比其他算法更容易概括为更多视图.

立体声算法仅为您提供深度图,即每个像素具有深度值的图像.这不允许您查看对象的"周围".然而,存在3D重建系统,其以图像对上的立体声开始并且组合深度图以便获得完整对象的表示,这本身就是一个非平凡的问题.有趣的是,这通常是使用体积表示作为中间步骤来实现的.

立体声算法可以并且经常用于"场景",例如由车辆中的一对相机观察到的道路,或者用于3D视频会议的房间中的人.

一些结束语

  • 对于立体和体积重建,图形切割只是解决该问题的几种方法之一.例如,立体声也可以被表述为连续优化问题,而不是离散优化问题,这意味着其解决方案的其他优化方法.
  • 我的回答包含一堆概括和简化.它并不意味着是对该主题的确定性治疗.

我并不一定同意立体声中的平滑度更容易.你为什么这么认为?