论文摘要
随着信息技术的发展,图像成为主要的信息载体,由此带来越来越多的图像数据给人工处理造成了巨大困难,高效地处理计算机图像信息成为人们关注的焦点。我们知道人的视觉能够在很短的时间内将注意力集中到图像中某个能激发人们兴趣的区域,如果学习人类视觉系统使用计算机可以有效并高效的处理图像信息,其中非常最关键的一个部分是预测视觉感兴趣区域。将人类视觉的选择性注意机制引入机器视觉来提高计算机图像信息处理的效率就成为当前的一种迫切需求。我们的研究发现人类不仅倾向于注意颜色、强度和方向对比突出的部分,也会被图片的细节内容,亮度变化剧烈的边缘纹理区域所吸引,而这些区域就是图片的高频成分。本文是在经典的Itti模型基础上基于自底向上机制建立的刺激驱动任务模型,假设视觉注意力都是由场景中强度、对比度、运动等底层刺激来驱动.这样得到的模型更具有普遍应用,因为它模拟了人类视觉系统的最基本最普遍的反应机制。本文采用小波变换来提取图片的高频和低频成分,然后再从这些成分中提取特征,最后得到显著图。小波变换是进行多尺度多通道分析的工具,图像经小波变换后,其高频部分代表细节,而低频部分表示物体的总体形状。由于小波变换利用人眼视觉系统在响应频带与空间方向选择上敏感性不同,将原图像在独立频带与不同空间方向上进行分解,因而更加符合人眼的视觉特性。论文的最后将提出的模型在MATLAB中实现,将模型结果图与其他模型在人类显著图的基础上作了多方面的比较,我们模型在多种类型的自然图像上都获得了较为满意的实验结果。