论文摘要
人类在感知外界环境的过程中,80%以上的信息来自于视觉。人类视觉感知系统中,初级视皮层从眼睛接收来自外界的信息,并按照由初级到中级,再由中级向高级的顺序分级进行信息处理。点和边缘是构成图像最基本的初级视觉特征,这些初级视觉特征经过编组形成边界及区域等中级视觉特征,以区域等中级视觉特征为基础,结合构成目标的各部分之间的结构关系,最终形成完整的目标。行人图像是各类自然图像中最常见、应用范围最广的一类,面对任何一幅复杂而陌生的行人图像,人们均可迅速、准确地找出其中有用的、属于目标本身的边缘、边界以及区域等显著结构,通过对这些显著结构的研究与分析,来完成整个行人目标的解析工作。如何模拟人类的视觉感知过程让计算机代替人工完成这一系列看似简单而实际复杂的工作是计算机视觉主要解决的问题。本文借鉴生物物理学和认知心理学的相关理论,结合概率统计等数学知识对此过程进行建模,通过对行人图像中的显著点、显著边缘、显著边界、显著区域等初级与中级视觉特征的研究与分析来实现对整个行人目标的解析,并将该解析模型应用于行人目标的分割、行人行走朝向预测以及行人目标检测的再估计等高级视觉处理过程中。其中,显著点与显著边缘为属于目标轮廓或者图像中不同区域边界上的点与边缘,边缘上所包含的显著点越多,其显著性也就越强;显著边界为构成目标轮廓的边界;而显著区域则为属于目标或者前景本身的区域。本文的主要工作包括以下三个方面:1)提出了基于认知心理学中格式塔规则的行人图像显著边缘等初级视觉特征的检测方法。首先使用尺度空间边缘(Scale Space Edges, SSE)与张量投票(Tensor Voting, TV)相结合的方法对行人图像中的显著点进行检测,并根据格式塔规则中“好的形状(Good Shape)"的原理,以边缘上包含显著点的情况、边缘的长度、光滑性以及稳定性等为线索对边缘的显著性加以判断,提出一种基于边缘能量与边缘稳定性的显著边缘的检测方法;对于背景、目标内部纹理和颜色比较复杂的图像,仅从长度、光滑性等边缘本身的特征出发很难得到理想的实验结果。鉴于此,进一步提出一种基于初级与中级视觉特征的显著边缘的检测方法。通过分析各边缘两侧区域内颜色与纹理的差异,并根据格式塔规则中的“闭合性(Closure)”原理对图像中的显著边缘进行检测。上述研究成果在行人图像和不同类别的图像中均进行了验证。该方法的优点在于不仅考虑到边缘本身的特性,还综合了颜色、纹理等能直接体现区域特性的初级视觉特征,所得到的显著边缘不仅节省了存储空间,还为下一步显著边界的检测提供了线索。2)提出了一种行人图像中显著边界等中级视觉特征的检测方法。显著边缘可以为高级的目标匹配、目标识别等工作提供线索,但很难直接应用于目标的解析与分割,因此,本文以显著边缘作为线索之一,对更加连续、光滑的组成目标轮廓的显著边界进行检测与分析。首先通过改变由gPb-OWT-UCM分层分割算法得到的分层分割图的阈值,产生一组软边界,然后分别对这组边界所包含显著边缘的情况,以及其长度、光滑性等属性进行度量,并根据知觉组织中的“接近律”原则对其进行编组,检测出其中属于同一个目标整体的显著边界。分别将检测到的显著边界和真实显著边界的形状与样本库中样本的形状进行匹配。通过显著边界的检测将图像分成了不同的区域,这些区域的形状及显著性可以为更高一级的视觉处理任务提供有力线索。3)提出了基于显著区域形状的行人目标解析模型及其在高级视觉处理过程中的应用。与基于语义的解析模型不同,本文提出一种基于句法的解析模型,其基本思想是将行人分成若干可视单元,并将这些可视单元归纳为永久部分与可能部分两种类型。根据知觉的整体性原理,模拟人类视觉感知过程,以永久部分为刺激起点,引发对目标其它可能部分的联想与推测,从而感知到整个目标。具体实现方法如下:首先以gPb-OWT-UCM分层分割算法得到的分割区域为基础,保留形状较显著的区域块,然后按照行人的树形解析结构,自底向上,从单个部分的形状出发,依次考虑各个部分组合的形状,直至整个行人的形状,最终解析出整个行人目标及其各个组成部分。本文还将该解析模型很好地应用于行人目标及其各个组成部分的分割,行人行走朝向的预测,以及行人目标检测的再估计等高级视觉处理过程中,这些实验结果均验证了该模型的有效性。
论文目录
相关论文文献
- [1].基于视觉感知特性的人机交互界面评价[J]. 合肥工业大学学报(自然科学版) 2019(12)
- [2].视觉感知训练对低视力儿童视觉感知能力、社会技能和活动表现的作用[J]. 解放军护理杂志 2020(01)
- [3].视觉感知与再现——里斯《黑暗中的航行》中的语象叙事[J]. 外国文学 2020(04)
- [4].“视觉感知与统计基础”全英文课程的实践[J]. 电气电子教学学报 2020(04)
- [5].论消费者对服装陈列的视觉感知[J]. 中外企业家 2018(07)
- [6].智慧工厂机器视觉感知与控制关键技术综述[J]. 中兴通讯技术 2016(05)
- [7].视觉感知的7个典型能力[J]. 中国眼镜科技杂志 2015(09)
- [8].提高英语阅读速度的主要障碍及其对策[J]. 科普童话 2017(03)
- [9].灯光视觉感知在室内设计中的重要性分析[J]. 明日风尚 2017(11)
- [10].视觉感知技术发展及智能化建议[J]. 电视技术 2019(05)
- [11].智能视觉感知与理解研究态势分析[J]. 计算机工程与应用 2018(19)
- [12].基于视觉感知分层的数字界面颜色编码研究[J]. 机械工程学报 2016(24)
- [13].视觉感知技术在人机交互小车控制中的应用研究[J]. 电子世界 2017(03)
- [14].三种用于视觉感知系统的算法比较[J]. 科技风 2015(01)
- [15].从“由是观之”类接入语看汉语视觉感知动词的征派条件[J]. 人文论谭 2017(00)
- [16].面向智能驾驶视觉感知的对抗样本攻击与防御方法综述[J]. 南京信息工程大学学报(自然科学版) 2019(06)
- [17].书法中蕴含力学的美[J]. 书法赏评 2018(04)
- [18].基于视觉感知的全参考图像质量评价算法[J]. 电子测量与仪器学报 2016(11)
- [19].视觉感知正反馈的显著性检测[J]. 中国图象图形学报 2017(07)
- [20].基于人类视觉感知的新图像编辑技术[J]. 办公自动化 2014(17)
- [21].无人艇光视觉感知研究发展综述[J]. 舰船科学技术 2019(23)
- [22].恶劣天气视觉感知增强技术研究[J]. 产业与科技论坛 2020(01)
- [23].基于视觉感知和行走行为的室内空间形态研究[J]. 西安建筑科技大学学报(自然科学版) 2019(03)
- [24].视觉感知在摄影艺术创作中的应用[J]. 艺术品鉴 2019(33)
- [25].机器人数目视觉感知系统的应用研究[J]. 计算机光盘软件与应用 2012(18)
- [26].智慧工厂机器视觉感知与控制关键技术综述[J]. 设备管理与维修 2018(24)
- [27].基于视觉感知偏差的公路几何平纵协调性分析技术[J]. 同济大学学报(自然科学版) 2015(09)
- [28].富士施乐开发出基于人类视觉感知的全新图像编辑技术[J]. 计算机与网络 2014(14)
- [29].现代视觉感知及其图式特点[J]. 南京社会科学 2014(08)
- [30].机器视觉感知三维图像中的人体行为识别算法[J]. 计算机仿真 2013(06)