位置信息与不变性局部特征结合的目标检测

论文摘要

视觉系统为人类提供了关于外在世界80%以上的信息,其在任何方面的能力几乎都超出了现有的机器视觉系统,近年来模拟视皮层信息处理成为了一个引人注目的课题。在目标识别领域,MIT的T. Poggio等提出了腹侧视觉通路前馈信息处理的分层最大化(HMAX)模型,通过不断改进,目前已经获得性能良好的、具有不变性的自然图像分类。另一方面,能够对“关系”建模的图概率方法在计算机视觉领域的应用越来越广泛,这些模型可以有效模拟由多个局部相互作用共同构成一个具有特殊功能的整体的过程。HMAX模型完全忽略了局部特征的全局位置信息,而在目标表象比较模糊的情况下,仅仅依靠目标部分的模糊表象很难获得满意的性能。本文提出了在HMAX模型的基础之上,用高斯马尔科夫随机场(GMRF)建模目标局部的全局位置关系的算法。该算法的处理过程是:首先像视觉皮层的标准模型(Standard Model)一样,随机选择局部特征(目标部分)并生成图像的分层表示;然后通过一个匹配程序从S2层的诸多局部最大值中选择唯一的部分位置,作为下一步学习空间先验的部分空间配置数据;最后把目标部分的位置关系建模为稀疏的GMRF图,并使用上一步得到的部分配置数据、通过套索(Lasso)方法学习图中的稀疏连接关系。对于新的检验图像,该算法通过最大化在某个特别的部分配置观测到目标的后验概率,来进行目标定位。在Caltech101数据库得到的实验结果说明我们提出的算法能够更准确地定位目标部分,同时其目标检测性能优于标准模型,证明对特征进行捆绑和增加表示部分的空间位置信息能够进一步提高识别性能。

论文目录

摘要

ABSTRACT

第一章绪论

1.1 课题背景

1.2 生理视觉的研究现状和发展趋势简介

1.3 类识别方法面临的主要问题以及相关模型

1.4 本文的研究内容和结构安排

第二章视觉目标识别的HMAX 模型

2.1 不变性感知以及HMAX 模型

2.1.1 腹侧流的视觉生理

2.1.2 建立视觉目标识别的计算机制所需要解决的几个问题

2.1.3 HMAX 模型的具体实现

2.2 其他流行的识别算法以及与HMAX 模型的联系与区别

2.2.1 尺度空间与兴趣点检测

2.2.2 不变性局部特征描述

2.2.3 特征袋方法

2.3 目标检测实验

2.4 HMAX 模型可能的改进

2.5 本章小结

第三章图概率模型及其在计算机视觉中的应用

3.1 图及其基本性质

3.1.1 条件独立性和无向图

3.1.2 无环有向图

3.2 图概率模型及其在视觉领域的应用实例

3.2.1 Bayesian 网络

3.2.2 条件随机场（CRF）

3.2.3 高斯马尔科夫随机场（GMRF）

3.3 本章小结

第四章用GMRF 建模局部特征的空间关系

4.1 模型介绍

4.1.1 关键点数据的获取

4.1.2 用GMRF 建模先验空间配置

4.1.3 基于GMRF 的目标检测

4.2 实验设计与结果

4.3 本章小结

第五章总结与展望

5.1 文章总结

5.2 未来工作展望

致谢

参考文献

作者在学期间取得的学术成果

位置信息与不变性局部特征结合的目标检测

论文摘要

论文目录

相关论文文献

猜你喜欢