用于3D重建的图切割算法的类型

Question

我已经阅读了几篇关于使用图形切割进行3D重建的论文,我注意到似乎有两种替代方法来解决这个问题.

一种方法是体积并描述体素的3D区域,其中使用图形切割来推断每个体素的二元标记(包含感兴趣的对象或不包含对象).采用这种方法的论文包括通过体积图切割的多视图立体声和遮挡强大的照片一致性以及使用全局图切割优化的表面重建.

第二种方法是2D,并试图用投影在那里的3D点的深度标记参考图像的每个像素.采用这种方法的论文包括通过图形切割计算视觉对应与遮挡.

我想了解每种方法的优点/缺点,以及在选择使用哪种方法时最重要的方法.到目前为止,我了解第一种方法的一些优点是:

第二种方法的一些优点是:

另外,我会对哪种情况我最好选择一种表示或另一种表示以及为什么感兴趣.

Answer 1

最重要的区别是算法通常使用的场景类型,以及它们表示对象的3D形状的方式.

体积方法表现最佳......

体积方法很受欢迎,用于重建"对象"(尤其是伪像).给定足够的视图(即图像),算法给出对象形状的完整体积(即体素)表示.可以使用Marching Cubes或类似方法将其转换为曲面表示.

您识别的第二种算法称为立体算法,图形切割只是解决此类问题的众多方法之一.立体声最好......

存在对两个以上图像(具有窄基线)的推广,但是大多数文献涉及双目(即两个图像)情况.有些算法比其他算法更容易概括为更多视图.

立体声算法仅为您提供深度图,即每个像素具有深度值的图像.这不允许您查看对象的"周围".然而,存在3D重建系统,其以图像对上的立体声开始并且组合深度图以便获得完整对象的表示,这本身就是一个非平凡的问题.有趣的是,这通常是使用体积表示作为中间步骤来实现的.

立体声算法可以并且经常用于"场景",例如由车辆中的一对相机观察到的道路,或者用于3D视频会议的房间中的人.

一些结束语

我并不一定同意立体声中的平滑度更容易.你为什么这么认为？