论文摘要
基于图像的三维重建一直以来都是计算机视觉领域的研究热点。通过图像进行三维重建是一种对人的视觉系统的模仿过程,它的目标是将二维图像场景转换成三维世界的场景,并应用于计算机辅助设计、智能社会、游戏娱乐等广泛领域。尽管对三维图像的重建已取得大量的研究成果,但由于来自图像的噪声干扰,重建结果仍然存在很多的不确定性,因此还有许多问题亟待解决。“结构化场景”指的是满足一定几何规则(例如共面,平行,垂直)的三维点集所构成的场景,比如建筑物,桥梁工程中的礅、台、桩基,室内家具等等。这种场景的特点是包含有很多以相互垂直的平面为主导的几何图元,这些图元之间存在的几何约束关系如垂直、平行等,可以直接应用于三维重建的相机自标定中。同时,这种场景的自动构网结果存在歧义性,往往需要较多的人工手段辅助。本文以基于多幅图像进行三维结构化场景的自动化和半自动化重建的关键技术为研究内容,以计算机视觉中的基础的多视几何理论为基本出发点,将模式识别中的聚类方法、文本检索领域中的快速相似度计算思想、视觉感知以及半自动化重建的几何推理引入到重建过程中,尝试通过相关领域的方法和理论来扩充传统的三维重建方法,并通过实验验证这种扩充的可行性,为后续的相关研究作出有意义的探索性工作。主要的研究内容和创新点包括:1、推导出针对针孔相机模型的基于灭点的相机自标定的公式,可以在已知三个正交灭点的前提下完成相机的自标定。针对现有曼哈顿方向灭点检测算法通常效率较低,不适应于实时计算的问题,本文提出了一种完全在图像空间进行处理的基于多模型估计的灭点检测算法MMVD。该方法利用检测到的直线段,通过多模型的一致性估计,完成初始的线段聚类和多灭点估计,再通过EM算法对结果进行优化计算,能够快速准确的估计出所有可能的灭点。在检测的多个灭点中,区分不同的情况,根据灭点的性质,可以快速地进行曼哈顿方向灭点的筛选。通过实验验证了灭点检测算法的效率和精确性。2、针对传统的迭代算法在图像匹配耗时较多和迭代过程易产生结果漂移的问题,本文提出了一种基于凝聚层次树的快速迭代重建算法FIRA,该算法是在Snavely的(?)undler算法的基础上改进完成。该算法在图像相似度计算阶段,借用海量文本检索领域的LSH模式,使用minhash算法,完成图像相似度的快速计算。利用相似度计算结果,构造凝聚层次树,用于指导迭代重建的过程,使得重建过程可控、高效而且可并行执行。该算法主要的优点在于图像相似度计算时,算法复杂度与图像大小无关,大大缩减图像匹配的时间。在迭代过程中,由于凝聚层次树指定了多条迭代的路径,可以把大的问题分割成为多个小问题,使得参数计算结果随图像数量增多出现漂移的问题得到解决。文中将FIRA算法和Bundler算法的流程进行分析比较,通过实验验证了算法的准确性和高效性。3、针对重建的三维几何模型的复杂性过高不利于实时绘制的问题,本文在Garland的QEM算法的基础上,提出了一个新的简化算法EQEM,用于快速生成LOD模型。这个简化算法综合考虑了几何和纹理特性。在几何算子的构建上,增加了对顶点曲率因素的考虑,并通过自定义的曲率计算公式降低曲率计算复杂度。在视觉简化算子的构建时,利用原始纹理图像中的边缘属性和边纹理差异,给每条边赋以视觉效果上重要性的权值。实验表明,通过该简化算子指导模型简化的每一个迭代步骤,可以使简化顺序更加合理,简化程度较高的模型也能够保持可接受的外观和形状特征。同时实验也证明,该算子能够使简化过程保证较好的速度。4、本文整合了前面三个章节的灭点检测算法MMVD,快速迭代重建算法FIRA和EQEM简化算法,给出一个基于多幅图像的结构化三维场景重建系统的设计与实现,并针对结构化三维场景在自动构网时往往结果差强人意的问题,提出了一个半自动交互式重建的方法。在相机已标定的前提下,这种方法能够序贯式地进行三维几何坐标推理,并通过体块工具完成几何模型的构建。在快速获取到几何模型后,利用相机的内外参数,完成自动的纹理映射,不需要任何的人工交互。这种方法可以快速生成满足应用需要的带有正交关系的结构化模型,并可以进行自动纹理贴图,和传统的建模过程相比,效率更高,几何建模更加精确。