论文摘要
在医学领域,随着医学影像设备的大量出现,医学图像已成为现代医疗中的一种基础性工具,医院每天会产生大量的包含病人生理、病理和解剖信息的医学图像,这些医学图像在临床诊疗、医学教学和科研活动中占有不可替代的地位,由此对医学图像数据进行有效的管理和检索产生了巨大的需求。传统的图像信息检索主要依靠文本注释、关键字来进行,然而这样带来一些严重的问题:一来由于如今图像信息数据量非常庞大,依靠人工查看并依次对图像进行注释,这样的效率远远达不到要求;二来依靠人工观察和注释非常地具有主观性,对同一幅图,不同的人可能有不同的看法和注释,甚至同一个人在不同时刻评价都不一样,这是非常不可靠的。于是,主要以图像内容为度量标准的基于内容的图像检索技术,成为近十几年来研究的热点,也是解决海量图像数据管理和查询的有效途径。基于内容的医学图像检索(Content Based Medical Image Retrieval, CBMIR)是从医学图像本身提取灰度、形状、纹理等底层视觉特征和高层语义特征,构成描述图像内容的特征向量,并以特征向量作为建立索引和匹配准则的客观依据检索所需图像。近年来,CBMIR技术已成为生物医学工程领域十分活跃的研究方向。目前,CBMIR采用的技术多半来自基于内容的图像检索(Content Based Image Retrieval, CBIR),但CBIR中的许多成熟技术并不能直接移植到CBMIR中,这主要是由医学图像本身的特点决定的:1)大多数医学图像是灰度图,不同的图像内容可能灰度信息相似,这使得常规的基于图像全局特征(如灰度直方图)的CBIR算法不适用于医学图像;2)自然图像往往含有可以区分类别的背景色彩,然而医学图像(如X线图像)的背景都为黑色,图像类别的区分仅依靠对图像中对象的分类来完成;3)医学上存在多种成像模式,针对不同模式的图像处理算法也会有所不同,提取的特征也有差异;4)图像处理技术在医学图像处理领域还面临着很多困难,如医学图像分割等;5)医学成像过程中会引入各种噪声、伪影、几何形变等干扰;6)医学图像灰度分辨率和空间分辨率高,所含信息量大。因此,必须寻求适合医学图像特点的特征提取算法和内容表示方法,才能使CBMIR获得成功。基于内容的医学图像检索的基本步骤是:对图像数据库中的所有图像进行图像预处理和分析,提取图像特征,建立特征库,并将特征库与图像库由特定的标识关联起来;在检索过程中,先提取检索样图相应的特征向量,然后将该特征向量与特征库中的特征向量进行比较,根据匹配结果在图像数据库中检索出所需要的图像返回给用户;然而,两幅底层特征相似度匹配程度高的图像在语义内容上可以相差很大,存在着所谓的“语义鸿沟”,它是制约基于图像底层特征的CBMIR性能的主要原因。产生“语义鸿沟”的原因有:1)计算机视觉对色彩特征的表示、相似度定义和人对色彩的感知存在着一定差距。一般的相似性距离表示的只是图像特征空间中的距离,而不是真正的图像语义之间的相似距离;2)高层语义概念同底层特征之间的差距。人们在日常生活中总是用一些高层次的概念,而计算机视觉技术从图像中提取的特征主要是低层次特征,除了人脸识别和指纹识别等特别领域,在大多数情况下,很难直接得到低层特征和高层特征之间的联系;3)人类感知的主观性。对于同一视觉内容,不同的人或者是同一个人在不同的情况下可能有不同的理解,这就是人类感知的主观性。这种主观性可能存在于不同层次上,例如某人可能对图像的颜色感兴趣;而另一人可能更多的注重图像的纹理特征;或者两人同样都是注重纹理特征,但他们各自所理解的纹理相似性也是完全不同的。事实上,任何一种纹理特征的表达形式都不能涵盖完整的图像信息,不同的特征表示方法是从不同角度来体现视觉特征的;4)有一些图像检索系统采用了多特征检索,由于不同的特征采用不同的相似性度量方法,很难找到一个比较合适的各特征综合距离以符合人对图像之间的相似度感知。如何解决“语义鸿沟”是目前CBMIR研究中最活跃的问题之一。目前缩减“语义鸿沟”的技术主要有:基于区域的图像检索、基于机器学习技术的图像语义分类、相关反馈(relevance feedback)、自适应相似度匹配函数、结合文本的CBMIR等,其中RF技术应用最为广泛且效果显著,RF允许用户对检索结果进行评价和标记,并反馈给系统,系统则利用反馈信息进行学习,并在再次检索返回更符合用户要求的查询结果。相关反馈原是一种在文字检索系统中使用的技术,它利用用户先前的检索结果信息进行反馈从而自动调节当前查询,在基于内容的图像检索中,检索一般总是通过一系列交互来完成的。首先用户进行一次初步查询,系统返回这次查询获得的最接近结果。用户对结果集合进行判断,标记满意的结果为正例,并可标记不满意的结果为反例。系统根据用户标记结果进行自我调整并进行新一轮检索。简单的说,就是将前一个查询的结果反馈到系统的输入端以改进下一个查询的输出效果。该过程可根据用户要求反复进行。相关反馈的目标是从用户与查询系统的实际交互过程中进行学习,发现并捕捉用户的实际查询意图,并以此修正系统的查询策略,从而得到与用户实际需求尽可能相吻合的查询结果。由于相关反馈可以实时地修改系统的查询策略,从而为图像检索系统增加了自适应功能。本文首先分析了基于内容图像检索技术的研究现状及存在的问题,详细阐述了基于内容的图像检索研究的各个关键技术,其中包括图像检索技术的发展阶段介绍、检索性能评价及分析、图像视觉特征的提取与表达等等,并且分析了基于内容图像检索中的多种相关反馈算法。详细介绍了NMF(非负矩阵分解)相关反馈应用到医学图像检索。对传统的乘法更新NMF迭代次数多,收敛时间慢等缺点,提出将投影梯度应用到NMF,在保证查全率查准率情况下,收敛速度大大的提高了。本文主要包括以下工作:1)系统介绍了基于内容的图像检索的基础知识和若干关键技术,针对医学图像的特点,提出了适合医学图像的灰度、纹理、形状、空间的特征提取,详细的分析了一些常用的特征提取方法,对各种特征进行有效的融合与选择来达到提高检索效率。2)为了缩小图像低层特征与图像在语义内容的差别,即所谓的“语义鸿沟”,将相关反馈技术引入图像检索系统中,在分析了各种相关反馈技术基础上,提出将NMF(非负矩阵分解)应用到相关反馈,对传统的乘法更新NMF迭代次数多,收敛时间慢等缺点,提出将投影梯度应用到NMF,实验证明,在保证查全率查准率情况下,收敛速度大大的提高了。