论文题目: 计算机视觉中摄像机定标及位姿和运动估计方法的研究
论文类型: 博士论文
论文专业: 控制理论与控制工程
作者: 伍雪冬
导师: 王耀南
关键词: 变内部参数摄像机自定标,度量重建,近似,插值近似,滤波器,位姿和运动估计
文献来源: 湖南大学
发表年度: 2005
论文摘要: 计算机视觉是一个相当新且发展十分迅速的研究领域,已成为智能自动化科学的重要研究领域之一,它的研究目标是使计算机具有通过一幅或多幅图像认识周围环境信息的能力,这种能力将不仅使机器能感知环境中物体的几何信息,包括它的形状、位置、姿态和运动等,而且能对它们进行描述、存储、识别和理解。 本文首先介绍了计算机视觉中所用到的射影几何、仿射几何、度量几何和欧氏几何等各类几何学的基本概念和相关特性;概述了摄像机模型及成像原理;回顾了近年来摄像机定标方法的发展,对存在的各种摄像机定标方法进行了分析、比较和总结;最后,重点阐述了变内部参数摄像机线性自定标、平面型场景图像的透视校正、四种非线性状态估计滤波器(EKF1、EKF2、DD1和DD2)及基于单目视觉的位姿和运动估计的研究方法。 ◆变内部参数摄像机线性自定标。在某些视觉系统中(例如机器人视觉系统、主动视觉系统)需要经常改变摄像机的位置或调整摄像机光学系统(如光圈与焦距),在每次调整以后,都需要对摄像机重新定标。针对这种情况,本文提出了一种可处理畸变因子和主点已知但其它内部参数发生变化时的摄像机自定标方法,该方法先计算图像间的基本矩阵,在计算基本矩阵后得到射影重建的基础上,用线性方法恢复同形矩阵,再利用同形矩阵计算摄像机内部参数。 ◆基于场景几何知识的三维度量重建。三维场景图像的度量重建一般是针对图像序列的,所使用的层次化度量重建方法都是首先得到图像序列的射影重建。如果三维物体表面都是平面(这种情况是比较常见的),则在平面型场景图像三维度量重建的基础上,基于场景几何知识,对平面型场景图像和常规的三维场景图像的度量重建进行了回顾,然后在此基础上提出了一种不必进行射影重建且只须单幅图像的三维度量重建方法。 ◆四种非线性状态估计滤波器(EKF1、EKF2、DD1和DD2)。对于某些系统不能用简单的线性模型来描述,因此必须发展非线性的滤波算法,在线性卡尔曼滤波的基础上,用一阶和二阶Taylor级数来近似非线性动态方程和测量方程,分别得到了EKF1(基于一阶Taylor近似)和EKF2(基于二阶Taylor近似)滤波器,但是使用EKF1和EKF2滤波器要求非线性动态方程和测量方程相应的一阶和二阶微分存在,在非线性动态方程和测量方程的一阶和二阶微分不存在时,用不需要计算微分的Stirling插值近似代替Taylor近似得出了另外两种新的滤波器,即DD1滤波器(基于一阶Stirling插值近似)和DD2滤波器(基于二阶Stirling插值近似)。 ◆基于单目视觉的位姿和运动估计。随着计算机视觉这门新兴学科的出现,计算机视觉中摄像机定标及位姿和运动估计方法的研究不需要物体接触或人工干预,估计两参考坐标系之间的相对三维位姿和运动对机器人导航、装配及测量、跟踪、目标识别和摄像机定标来说也是一个非常重要的研究问题。利用单摄像机所获取的二维图像序列来估计两坐标系之间的相对位姿和运动在实际应用中是可取的,其难点是从物体的三维特征投影到二维图像特征的过程是一个非线性变换,本文研究了在运动物体尺寸和形状己知的情况下,三维坐标变换用八元数表示,用单摄像机获取运动物体的图像,以线特征作为测量输入,建立了位姿和运动估计系统的非线性模型,分别用IEKFI、IEKFZ、DDI和DDZ四种滤波器进行了仿真比较,得出了位姿和运动估计结果。关键词:变内部参数摄像机自定标;度量重建;Taylor近似;stirling插值近似;滤波器;位姿和运动估计
论文目录:
摘要
Abstract
第1章 绪论
1.1 计算机视觉研究的内容
1.2 计算机视觉的发展现状
1.3 本文研究问题的提出
1.3.1 摄像机定标
1.3.2 基于场景几何知识的三维度量重建
1.3.3 非线性状态估计滤波器
1.3.4 位姿和运动估计
1.4 主要研究成果和结构安排
第2章 几何学基础
2.1 变换
2.1.1 欧氏平面的变换
2.1.2 欧氏空间的变换
2.2 射影几何
2.2.1 射影直线
2.2.2 射影平面
2.2.3 射影空间
2.3 仿射几何
2.3.1 仿射平面
2.3.2 仿射空间
2.4 度量几何
2.4.1 度量平面
2.4.2 度量空间
2.5 欧氏几何
2.6 本章小结
第3章 摄像机定标
3.1 图像坐标系、摄像机坐标系与世界坐标系
3.2 摄像机模型
3.2.1 针孔摄像机模型
3.2.2 非线性摄像机模型
3.3 绝对二次曲线Ω和绝对二次曲面Ω~*
3.4 传统的摄像机定标方法
3.4.1 三维定标物
3.4.2 平面型定标物
3.4.3 两步定标法
3.4.4 双平面定标
3.5 自定标
3.5.1 运动已知的主动摄像机自定标
3.5.2 正交性约束
3.5.3 平面型场景
3.5.4 Kruppa方程自定标
3.5.5 层次化自定标
3.5.6 立体摄像机自定标
3.5.7 纯平移
3.5.8 纯旋转
3.5.9 奇异(critical)运动
3.5.10 变内部参数自定标
3.6 本章小结
第4章 基于射影重建的摄像机变内部参数线性自定标
4.1 双摄像机几何约束原理
4.2 射影几何意义下的三维重建
4.3 基于射影重建的摄像机自定标
4.3.1 计算基本矩阵F
4.3.2 计算同形矩阵H
4.4 实验仿真
4.5 本章小结
第5章 基于场景几何知识的三维度量重建
5.1 三维度量重建基本原理
5.2 平面型场景图像的三维度量重建
5.3 三维场景图像的度量重建
5.4 单幅三维物体图像的度量重建
5.5 实验仿真
5.6 本章小结
第6章 基于Taylor近似的非线性系统状态估计
6.1 非线性函数的Taylor近似
6.2 非线性函数均值和方差的Taylor近似
6.2.1 一阶Taylor近似
6.2.2 二阶Taylor近似
6.3 基于Taylor近似的非线性系统状态估计
6.3.1 非线性系统状态估计的回顾
6.3.2 EKF1滤波器
6.3.3 EKF2滤波器
6.4 迭代滤波
6.5 本章小结
第7章 基于Stirling插值近似的非线性系统状态估计
7.1 非线性函数的Stirling插值近似
7.2 均值和方差的Stiring插值近似
7.2.1 一阶Stirling插值近似
7.2.2 二阶Stirling插值近似
7.3 基于Stirling插值近似的非线性系统状态估计
7.3.1 DD1滤波器
7.3.2 DD2滤波器
7.4 本章小结
第8章 IEKF1,IEKF2,DD1和DD2滤波器在基于单目视觉的位姿和运动估计中的应用
8.1 相关研究工作
8.1.1 基于点特征的位姿估计方法
8.1.2 实时位姿估计方法
8.1.3 用高阶几何元素的基于模型的位姿估计方法
8.1.4 包含噪声不确定性估计的位姿估计方法
8.1.5 基于卡尔曼滤波(KF)的直接位姿和运动估计方法
8.2 八元数
8.2.1 二元数
8.2.2 四元数
8.2.3 八元数
8.3 空间点三维旋转的单位四元数表示
8.4 三维旋转和平移的单位八元数表示
8.5 位姿和运动估计系统的状态方程
8.6 位姿和运动估计系统的动态方程
8.7 位姿和运动估计系统的测量方程
8.8 实验仿真
8.9 本章小结
结论
1 本论题已完成的研究工作
2 后续工作及展望
参考文献
致谢
附录A(攻读博士学位期间发表的论文目录)
发布时间: 2005-04-04
参考文献
- [1].基于关注度机制的图像理解[D]. 郭聪.中国科学技术大学2018
- [2].移动变尺度目标检测与跟踪算法研究[D]. 顾钦.电子科技大学2018
- [3].基于计算机视觉的三维测试技术研究[D]. 杨述平.中北大学2005
- [4].计算机视觉检测基础理论及应用技术研究[D]. 段发阶.天津大学1994
- [5].颗粒粒径和形态计算机视觉测量方法研究[D]. 孔明.东南大学2005
- [6].基于计算机视觉的汽车整车尺寸测量系统的研究[D]. 翟乃斌.吉林大学2007
- [7].计算机视觉中双目匹配相关技术研究[D]. 夏永泉.南京理工大学2007
- [8].计算机视觉三维重建若干技术研究[D]. 赵颜利.南京理工大学2007
- [9].光电经纬仪跟踪飞机的3D计算机视觉研究[D]. 王习文.中国科学院研究生院(长春光学精密机械与物理研究所)2010
- [10].基于计算机视觉的人体行为识别研究[D]. 邵延华.重庆大学2015
相关论文
- [1].智能机器人视觉信息处理及数据融合方法研究[D]. 原新.哈尔滨工程大学2004