论文摘要
视觉系统为人类提供了关于外在世界80%以上的信息,其在任何方面的能力几乎都超出了现有的机器视觉系统,近年来模拟视皮层信息处理成为了一个引人注目的课题。在目标识别领域,MIT的T. Poggio等提出了腹侧视觉通路前馈信息处理的分层最大化(HMAX)模型,通过不断改进,目前已经获得性能良好的、具有不变性的自然图像分类。另一方面,能够对“关系”建模的图概率方法在计算机视觉领域的应用越来越广泛,这些模型可以有效模拟由多个局部相互作用共同构成一个具有特殊功能的整体的过程。HMAX模型完全忽略了局部特征的全局位置信息,而在目标表象比较模糊的情况下,仅仅依靠目标部分的模糊表象很难获得满意的性能。本文提出了在HMAX模型的基础之上,用高斯马尔科夫随机场(GMRF)建模目标局部的全局位置关系的算法。该算法的处理过程是:首先像视觉皮层的标准模型(Standard Model)一样,随机选择局部特征(目标部分)并生成图像的分层表示;然后通过一个匹配程序从S2层的诸多局部最大值中选择唯一的部分位置,作为下一步学习空间先验的部分空间配置数据;最后把目标部分的位置关系建模为稀疏的GMRF图,并使用上一步得到的部分配置数据、通过套索(Lasso)方法学习图中的稀疏连接关系。对于新的检验图像,该算法通过最大化在某个特别的部分配置观测到目标的后验概率,来进行目标定位。在Caltech101数据库得到的实验结果说明我们提出的算法能够更准确地定位目标部分,同时其目标检测性能优于标准模型,证明对特征进行捆绑和增加表示部分的空间位置信息能够进一步提高识别性能。