论文摘要
双目视觉是场景三维重建中的一种很重要的技术,它利用由摄像机所拍摄的两幅或多幅二维图像,依据其中包含的几何等关系将场景的三维信息重构出来。该技术在计算机视觉、计算机图形学和虚拟现实等许多领域有广泛应用。和结构光视觉等技术相比,它不需要额外向场景进行光线投射,隐蔽性较好,具有一般主动视觉不可比拟的优势。本文对双目视觉的匹配以及去噪方面进行研究。双目视觉基于视差原理对图像进行重构。其中最为关键的问题是进行两幅图像问对应像点的匹配。由于场景由三维向二维影射时丢失了一个维度的信息,所以此技术便试图用两幅或多幅图像将此维度的信息重构出来。但是因为现实场景大都不太规则,再加上采样点的有限性,这就造成了匹配的歧义性。而且由于三维场景中的遮挡以及模糊等原因,导致对应匹配点在两幅图像中有时不能同时出现,或者在颜色等方面并不完全相同。为了更好的进行图像场景点的匹配,本文提出了一种新的匹配方法,基于双向双极线的匹配技术。这种技术通过对应极线跳变点的匹配来实现两条极线上各像点的匹配,可在一定程度上解决场景遮挡等问题。而且相对于图像像素灰度值来说,跳变点受光线变化的影响不那么明显,所以在匹配中更具有鲁棒性。此外,用此种方法可以较好的解决初始匹配点的问题。针对匹配问题,当前已经提出了许多种计算及优化算法,比如采用迭代的计算方法。这种方法首先确定一些初始的匹配,然后再根据某种准则对当前的匹配结果进行优化,直到满足一定的要求为止。另外,也有些文章采用动态规划算法,以寻求某种最优匹配。这些算法一般都要花费相当长的时间,而不能满足实时重建的要求。而采用本文的匹配方式,首先使用跳变点而不用像点匹配,大大减少了需要匹配的元素,然后中间点用插值方式匹配。当给定首对匹配点时,这种匹配可在线性时间内完成。另外,本文还提出了一种新的检测方式,以去除偏差较大的匹配情形。实验结果表明,采用本文提出的算法,当场景比较规则,而且边缘比较清晰时,可以达到很好的匹配结果。如果场景不规则,或是边缘比较模糊时,由于使用了差分方式来检测边缘,这也可以达到较好的结果。而且采用这种方法,当给定首对匹配点时,匹配可在线性时间内完成,基本可以达到实时的要求。