gpt4 book ai didi

disparity-mapping - 如何解释视差值

转载 作者:行者123 更新时间:2023-12-02 03:55:10 31 4
gpt4 key购买 nike

假设我们有两张来自立体相机的已知像素位置的校正照片,我们想要绘制视差图

如果右边照片中的像素在两个方向上移动,那么最近的像素是多少?我知道,如果我们执行 q.x -p.x(p 是左图中的一个像素),那么最远的点就是具有最小值的点,那么这个点的最大值是最近的吗?

谢谢

最佳答案

视差图通常用带符号的值表示,表示像素从立体对中的一幅图像移动到另一幅图像的方向。例如,如果您在左 View 中的位置 <100,250> 有一个像素,而在右 View 中相应的像素位于位置 <115,250>,那么左 View 在位置 <100,250> 的视差图的值为 15。位置 <115,250> 处右 View 的视差图的值为 -15。

视差图可以是多 channel 图像,通常在第一个 channel 中具有 x 位移,在第二个 channel 中具有 y 位移。如果您正在查看具有大量视差的高分辨率立体对,您可能无法将所有可能的视差值都放入 8 位图像中。在电影行业中,大多数视差图都存储为 16 位或 32 位浮点图像。

没有衡量差异的标准方法,通常不赞成使用这种方法,因为差异旨在描述“物理/具体/不可变/等”属性。然而,有时这是必要的。例如,如果您想在 8 位图像中记录大型立体对的视差,则必须缩放值以适应 8 位容器。您可以通过许多不同的方式来做到这一点。

缩放视差图的一种方法是取最大的绝对视差值并将所有值除以一个因子,该因子将把该值减小到带符号的 8 位世界中的最大值 (128)。这种方法很容易使用简单的乘法器缩小到原始视差范围,但由于除法产生的步长减少,显然会导致细节减少。例如,如果我有一个视差范围为 50 到 -200 的图像,这意味着我有 250 个可能的视差值。我可以将所有值除以 200/128 = 1.5625。这给了我 32 到 -128 或 160 个可能的视差值的范围。当我使用乘法缩放这些值时,我再次得到 50 到 -200,但现在该范围内只有 160 个可能的视差值。

使用上述视差范围的另一种方法是简单地移动范围。总范围是 250,我们带符号的 8 位容器可以容纳 256 个值,所以我们从所有值中减去 250-128 = 72,得到 122 到 -128 的新范围。这使我们能够保留所有的视差步骤,只需将我们的移位因子添加回图像即可获得准确的输入图像。

相反,如果您有范围为 -5 到 10 的视差图。您可能希望扩展该范围以包括子像素视差值。所以你可以将 10 放大到 128,将 -5 缩小到 -64。这提供了更广泛的值范围,但可能值的总数将根据输入视差范围在帧与帧之间发生变化。

缩放方法的问题在于它们可能是有损的,并且每个保存的图像都会有一个需要反转的缩放因子/方法。如果每个图像都有一个单独的比例因子,那么该因子必须与图像一起存储。如果每个图像都具有相同的比例因子,那么由于可能值的减少,数据会出现更大的退化。这就是为什么通常好的做法是以更高的位深度存储视差图以确保数据的完整性。

关于disparity-mapping - 如何解释视差值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44184676/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com