双眼立体认知模型

双眼立体认知模型

论文摘要

双眼立体视觉是指人类通过双眼融合获得物体的三维立体形状,准确判断物体三维空间位置的高级视觉功能。在过去一个半世纪以来,对它的研究一直是一个十分活跃的领域。在上世纪60年代,Julesz率先用计算机设计的随机点立体图对(RDS)来进行立体视觉研究,并发现只要有视差不需要形觉也能产生深度感。这一发现揭示立体视觉的发生是在形状识别之前,因此成为立体视觉研究的一个里程碑。以此为基础,研究人员对视差的计算开展了一系列研究,在心理物理学和神经生理学方面均取得了令人瞩目的进展,但同时也存在着一些难以解决的困难。在对随机点立体图研究的基础上,Julesz提出了一种立体协同模型。该模型假设,双眼网膜刺激物在皮层上的对应点,以类似于磁偶极子相互作用的方式进行匹配,对应点的视差可以用磁偶极子的旋转量表示。70年代Marr基于计算理论建立了模拟人类立体视觉机制的匹配算法,该理论认为,立体视觉匹配三大约束(唯一性、相容性和连续性)是立体视觉的重要组成部分。其后,研究者还提出了一些基于生理过程的立体视觉模型,其中有代表性的一种模型即能量模型。这种模型认为,皮层上一组复杂视差敏感细胞能够有效的计算一对对应点的视差的大小。但是这些立体知觉模型都存在着共同的难以解决的根本性困难,即对应性匹配问题(视差悖论问题)。在以往的文献中视差被定义为空间上一个刺激物在两个视网膜上投影点间的位置差。按照这个定义,会导致随机点立体图研究的实验结论(立体知觉发生在形觉之前)成为悖论:如果视差定义成立,只要有视差就能产生深度感,就需要先找到精确的对应点;但找精确的对应点需要先识别,这样就和随机点立体图的研究结论(立体知觉发生在形觉之前)矛盾。为了解决现有立体知觉模型的困难,本文引用了神经解剖学的研究成果,在人类实际的视觉加工过程的基础上,将眼动和立体知觉的关联引入立体认知机制中,提出了一种创新性的立体知觉模型,其主要内容有:1.新模型以神经解剖学的研究成果和人类实际的立体知觉加工过程为基础:a.引用了近年来的神经解剖学的研究成果:视皮层上的双眼细胞只可能接收网膜上两个生理对应点的信号,而不是物理刺激对应点的信号。可以看出,现有的立体知觉模型要计算视网膜上物理刺激对应点的位置差,是非常困难的。因此,有理由认为,人类的双眼立体视觉是通过处理视网膜上生理对应点的信号来实现的,而不是现有的模型所设想的,通过计算物理对应点视差来实现。b.考察了正常情况下人类实际的立体知觉加工过程:有正常立体视的人观察物体时,视系统总是尽量让两者重合,以消除差别。立体视的形成,除了健全的视神经系统外,眼肌的配合,或者是幅合运动,将是一个关键的、必要的条件。如果眼肌不能配合,无法双眼凝视或幅合,则不能将物象投影到各自的网膜的中央窝,则双眼立体视觉不可能完成。2.在神经解剖学和人类实际的视觉加工过程的基础上,模型提出,要将两只眼睛独自观看到的两个平面的世界表征成一个立体的世界,需要通过眼动调节将这两个平面的世界“混合”成一个单一的世界,眼动调节由视网膜上生理对应点的光信号来控制。3.模型认为,双眼立体知觉的形成,是知觉支配下的外周眼动调节和感觉记忆加工过程。左右眼视网膜上生理对应点的光信号的差,引起眼睛的调焦和辐辏运动;左右眼视网膜上生理对应点的光信号的和,传导至中央执行系统,由此引起连续的知觉。立体知觉形成的过程就是眼睛动态反馈调节的过程,深度感的大小由稳定状态下眼肌的紧张度决定。本文的立体认知模型不仅解决了现有模型的对应性匹配困难,而且,本文的模型可以解释大量的立体知觉现象,相比而言,现在的立体知觉研究中,大量的立体知觉现象却需要很多不同的知觉理论去解释。依据我们的立体认知模型,脑对双眼信息的立体知觉加工,远比我们想象的要简洁和省力,并且无需我们对自己如何完成这些认知操作具有任何洞察力。

论文目录

  • 摘要
  • Abstract
  • 第一章 双眼立体模型综述
  • 1.1 Julesz 随机点立体图对及立体协同模型
  • 1.2 Marr 视觉计算模型
  • 1.3 立体时空能量模型
  • 1.4 各种立体知觉模型共同的根本性困难
  • 第二章 问题的提出和研究方案
  • 2.1 问题的提出
  • 2.2 研究思路和方案
  • 第三章立体知觉现象中视差及眼动的作用
  • 3.1 正常视系统的求同原理
  • 3.2 眼动在立体知觉中的作用
  • 3.3 眼动立体认知模型
  • 3.3.1 视网膜像及其描述
  • 3.3.2 视网膜生理对应点信号差及其作用,聚散控制和屈光度调节
  • 3.3.3 双眼世界的“混合”
  • 3.3.4 立体知觉的形成
  • 3.3.5 眼动立体认知模型的应用
  • 第四章 眼动立体认知模型可以统一解释复杂的双眼立体知觉现象
  • 4.1 垂直视差引起的立体知觉
  • 4.2 亮度和颜色差异引起的深度知觉现象
  • 4.2.1 静态的双眼亮度差异刺激物引起的立体现象
  • 4.2.2 运动的双眼亮度差异刺激物引起的立体知觉现象-普氏摆立体现象
  • 4.3 遮挡形成的立体知觉现象
  • 第五章 眼动认知模型总结和展望
  • 参考文献
  • 致谢
  • 附录:攻读学位期间发表的论文
  • 相关论文文献

    • [1].达芬奇立体中的背景匹配加工[J]. 中南民族大学学报(自然科学版) 2008(01)
    • [2].长途客车的形态语义分析与认知[J]. 工业设计 2018(02)

    标签:;  ;  ;  ;  

    双眼立体认知模型
    下载Doc文档

    猜你喜欢