基于认知的立体视觉技术研究

基于认知的立体视觉技术研究

论文摘要

视觉认知作为脑科学及认知科学分支之一,主要的研究工作就是探索大脑内部的视觉信息处理是在何处如何进行的。从事模式识别的人更加关心大脑是如何处理视觉信息的,他们利用神经生理学的最新研究成果建立起了基于认知的机器视觉,主要研究在视皮层视差检测中的眼动机制和视觉注意机制。到目前为止,这两种算法视皮层视差检测机制和视觉注意机制都是处理各自领域的,并没有真正的交叉融合起来,这两者的融合是立体视觉认知中需要进一步解决的问题。本文针对以上问题进行了探索和研究,在借鉴前人的研究成果基础上提出新方法,并通过实验证明了所提方法的有效性。论文的主要工作包括以下几个方面:(1)将视皮层视差检测机制和视觉注意机制放在同一个框架下来研究。视皮层视差检测机制的研究目标是通过认知的计算模型从二维图像中获取三维环境信息,而视觉选择机制则研究的是如何利用物体与周围环境的颜色,形状等信息模拟主体在海量的视觉信息中视觉焦点的提取和转移。本文通过分析两者间内在联系和相互关系,并将其统一至同一框架中进行研究。然后结合亮度,颜色,方向等特征引导的自下而上的视觉注意计算模型来提取有意义的物体信息并把信息反馈到视差检测模型,对视差检测模型中加以指导。(2)提出视皮层视差检测机制中置信点扩散算法。认知神经科学指出视皮层视差检测机制中位置差和相位差同时存在,这为视差能量模型理论提供了支持。本文结合了视皮层视差检测的最新研究成果和传统视差理论的约束条件,以图像平移模拟眼动机制实现位置差检测的计算模型,使用一维Gabor滤波器提取相位来实现相位差的计算模型,最后通过概率学的内容,对眼动过程中提取的所有的深度加以判定和选择生成视差图。并在视皮层视差检测机制中融入了置信点扩散的算法,对生成的视差信息加以判断和修订。实验结果表明置信点的提出可以降低误匹配率。(3)视觉注意下的眼动机制。在传统的视皮层视差检测机制中,并没有考虑眼动机制的约束和限制,传统的图像平移包括了整个视差可能出现的范围,没有发挥大脑的能动性。结果造成了计算量大、视差信息臃肿等缺点。本文利用提取的视觉注意焦点对眼动机制加以控制,在眼动的过程中利用视差能量模型检测视觉焦点的匹配结果,从而大大的减少了匹配的计算量。(4) BPA算法在重建三维场景中的使用。BPA算法是一种在三维空间建立标准化三角网的算法,算法有着高效性和鲁棒性,广泛的应用在人脸重建等领域。本文把这种算法的应用范围加以扩展,在场景重建中使用了这种算法。结果表明,该算法在场景重建中也有着很高的可靠性和有效性,完全可以满足场景重建的需要。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 计算机视觉的研究背景及意义
  • 1.2 立体视觉关键技术
  • 1.3 基于认知的计算机视觉
  • 1.3.1 视皮层细胞的视差检测机制
  • 1.3.2 视觉选择机制
  • 1.3.3 认知中两种机制共同研究的可行性和必要性
  • 1.4 本文主要工作及内容安排
  • 第2章 传统立体匹配的概念及算法
  • 2.1 立体匹配的分类
  • 2.2 立体匹配中的约束算法
  • 2.3 视差和视差图
  • 2.4 局部匹配算法
  • 2.4.1 相关研究
  • 2.4.2 相似性度量算子
  • 2.4.3 匹配窗口的选择
  • 2.5 相位匹配
  • 2.6 小结
  • 第3章 视皮层中的立体视觉信息处理
  • 3.1 视觉通路中的立体视觉信息处理
  • 3.1.1 视觉通路
  • 3.1.2 感受野
  • 3.2 视差检测细胞的编码方式
  • 3.3 视差能量模型
  • 3.4 眼动机制
  • 3.5 贝叶斯后验估计
  • 3.6 能量模型中的置信点选取以及视差图的生成
  • 3.7 小结
  • 第4章 基于视觉注意的视差机制
  • 4.1 引言
  • 4.2 视觉注意机制与视觉选择注意计算模型的研究
  • 4.2.1 视觉注意机制
  • 4.2.2 视觉选择注意计算模型
  • 4.3 视觉特征的多尺度空间表示
  • 4.4 基于自下向上的视觉注意模型
  • 4.4.1 亮度特征图
  • 4.4.2 颜色特征图
  • 4.4.3 方向特征
  • 4.4.4 低层特征显著图
  • 4.5 多特征图整合策略
  • 4.5.1 直接相加法
  • 4.5.2 有监督的学习法
  • 4.5.3 全局加强法
  • 4.6 视觉注意显著图
  • 4.7 注意焦点提取和转移
  • 4.8 基于视觉选择机制的立体匹配
  • 4.9 小结
  • 第5章 三维重建
  • 5.1 引言
  • 5.2 求视差图中各点的三维坐标
  • 5.3 三维重建的预处理计算
  • 5.3.1 中值滤波
  • 5.3.2 亚象素差值
  • 5.4 建立三角网
  • 5.5 实验结果
  • 5.6 小结
  • 第6章 总结与展望
  • 6.1 论文总结
  • 6.2 研究展望
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    • [1].齐泽克论视差分裂[J]. 理论界 2020(01)
    • [2].测量仪器视差产生原因及处置方法的研究[J]. 科技资讯 2016(28)
    • [3].西方文论关键词:视差[J]. 外国文学 2016(01)
    • [4].立体图像视差线性调整算法[J]. 哈尔滨工业大学学报 2016(05)
    • [5].基于稳定树的立体匹配视差优化算法[J]. 计算机辅助设计与图形学学报 2016(12)
    • [6].3-D视频的视差优化调整方法[J]. 清华大学学报(自然科学版) 2014(10)
    • [7].视差[J]. 老同志之友 2011(14)
    • [8].论齐泽克的视差辩证法——康德、黑格尔与拉康的视差解读[J]. 南京大学学报(哲学·人文科学·社会科学) 2020(04)
    • [9].一种改进的相邻块视差矢量快速获取方法[J]. 西安邮电大学学报 2019(06)
    • [10].基于V-视差的障碍物检测算法的研究[J]. 电子世界 2017(11)
    • [11].基于视差变化连续性调节的3D视频舒适度增强[J]. 吉林大学学报(信息科学版) 2016(01)
    • [12].三维视频通信中视差技术的改进[J]. 广州航海学院学报 2016(01)
    • [13].快速视差范围估计算法及其应用[J]. 计算机辅助设计与图形学学报 2015(01)
    • [14].视差滚动设计的审美价值研究[J]. 艺术与设计(理论) 2015(08)
    • [15].左派辩证法视域下的视差——从柄谷行人到齐泽克[J]. 中外文化与文论 2019(01)
    • [16].小视差交叉视差认知过程研究[J]. 长春理工大学学报(自然科学版) 2013(06)
    • [17].立体内容舒适视差范围研究[J]. 吉林大学学报(工学版) 2013(S1)
    • [18].视差滚动网页布局的用户体验[J]. 装饰 2013(09)
    • [19].视差计算的层级模型[J]. 中国科学:信息科学 2013(09)
    • [20].语言视差的多维理据及其翻译策略[J]. 遵义师范学院学报 2012(05)
    • [21].认同与抵触——韩剧热背后的文化视差[J]. 戏剧文学 2008(09)
    • [22].一种大视差场景下的实时视频拼接系统[J]. 计算机与现代化 2020(04)
    • [23].基于纵向视差的铁路危树检测[J]. 计算机工程与应用 2020(21)
    • [24].基于分割导向滤波的亚像素精度立体匹配视差优化算法[J]. 模式识别与人工智能 2016(10)
    • [25].面向三维立体动画制作的视差可视化调节方法设计与实现[J]. 计算机辅助设计与图形学学报 2017(07)
    • [26].浅析手机拟物化视差界面设计[J]. 明日风尚 2018(03)
    • [27].3D显示方式与视差对视觉疲劳的影响研究[J]. 中山大学学报(自然科学版) 2013(05)
    • [28].无形变视差调节快速算法[J]. 光电子.激光 2014(05)
    • [29].空情导引中视差修正技术[J]. 兵工自动化 2012(09)
    • [30].静态立体图视差图形与立体视锐度相关关系探讨[J]. 山东医药 2011(26)

    标签:;  ;  ;  ;  ;  

    基于认知的立体视觉技术研究
    下载Doc文档

    猜你喜欢