如何解释视差值

Raz*_*iel 3 disparity-mapping

假设我们有两张来自立体相机的已知像素位置的校正照片,并且我们想要绘制视差图

如果右侧照片中的像素在两个方向上移动,最接近的像素是什么?我知道如果我们执行qx -px (p 是左侧照片中的像素) ,最远的点 就是具有最小值的点,那么最大值是最近的吗?

谢谢

BHa*_*awk 6

视差图通常用带符号的值来表示,该值指示像素从立体对中的一个图像移动到另一图像的方向。例如,如果左视图中的位置 <100,250> 处有一个像素,而右视图中相应的像素位于位置 <115,250> 处,则左视图中位置 <100,250> 处的视差图的值为 15。位置 <115,250> 处右视图的视差图值为 -15。

视差图可以是多通道图像,通常在第一通道中具有 x 偏移,在第二通道中具有 y 偏移。如果您正在查看具有大量视差的高分辨率立体对,您可能无法将所有可能的视差值放入 8 位图像中。在电影行业中,大多数视差图存储为 16 或 32 位浮点图像。

没有缩放视差的标准方法,并且通常不受欢迎,因为视差旨在描述“物理/具体/不可变/等”属性。然而,有时这是必要的。例如,如果您想在 8 位图像中记录大型立体对的视差,则必须缩放这些值以适合 8 位容器。您可以通过多种不同的方式来做到这一点。

缩放视差图的一种方法是采用最大的绝对视差值,并将所有值除以一个系数,该系数会将该值减小到带符号的 8 位世界中的最大值 (128)。这种方法很容易使用简单的乘法器缩小到原始视差范围,但由于除法产生的步长减少,显然会导致细节的减少。例如,如果我的图像视差范围为 50 到 -200,则意味着我有 250 个可能的视差值。我可以将所有值除以 200/128 = 1.5625。这给了我 32 到 -128 或 160 个可能的视差值的范围。当我使用乘法将这些值放大时,我再次得到 50 到 -200,但现在该范围内只有 160 个可能的视差值。

使用上述视差范围的另一种方法是简单地移动该范围。总范围是 250,我们的带符号 8 位容器可以容纳 256 个值,因此我们从所有值中减去 250-128 = 72,这给出了 122 到 -128 的新范围。这使我们能够保留所有视差步骤,并只需将移位因子添加回图像即可获得准确的输入图像。

相反,如果您的视差图范围为 -5 到 10。您可能希望扩展该范围以包含子像素视差值。因此,您可以将 10 放大到 128,将 -5 缩小到 -64。这提供了更广泛的值范围,但可能值的总数将根据输入视差范围而随帧而变化。

缩放方法的问题在于它们可能是有损的,并且每个保存的图像都将具有需要反转的缩放因子/方法。如果每个图像都有单独的缩放因子,则该因子必须与图像一起存储。如果每个图像具有相同的缩放因子,则由于可能值的减少,数据会出现更大的退化。这就是为什么以较高位深度存储视差图以确保数据完整性通常是一种好的做法。