论文摘要
基于内容的图像检索(Content Based Image Retrieval,CBIR)是一个热门的研究领域,取得了许多令人瞩目的成就,且发展势头异常迅猛。图像语义索引是基于内容的图像检索研究领域中一个重要而又有挑战性的问题。图像和视频正在成为多媒体的主要表现形式,实现图像内容的语义索引成为迫切的需要。由于传统的手工标注索引不仅需要耗费巨大的人力物力,效率低下,无法应付增长速度远远超过预计的图像库,而且在对图像语义索引标注的过程中易受到人为的非客观因素的影响。因此,图像的自动语义索引成为了支持图像语义检索的一个重要技术。由于传统的支持向量机(Support Vector Machine,SVM)作为典型的二元分类器,在处理多类分类问题时存在不可分样本的问题,本文引入模糊支持向量机(Fuzzy SupportVector Machine,FSVM),通过定义模糊隶属度函数来弥补传统支持向量机在解决多类分类问题时的不足。鉴于模糊支持向量机在多类分类问题中的出色表现,本文将其应用于图像语义索引领域中,在图像分类思想的基础上,提出了一种新的图像语义索引方法。为了更加准确地索引图像,本文借鉴人类基于图元的图像内容理解思想,即首先是对图像中感兴趣的、典型的、有意义图像块的认识(本文将这些图像块称之为图元),然后再通过对整幅图像中图元之间的空间结构关系、布局以及更高层的语义理解,综合成对整幅图像的理解,提出了加权图像金字塔结构。在语义索引的过程中,模糊支持向量机主要用于训练概念模型库中的各个语义模型及计算图像样本与模型之间的关联度;然后根据加权金字塔结构统计样本与模型库中各个模型之间的关联度,最后根据图像与模型之间的关联度对图像进行索引,实现基于图像分类思想的智能化的、合乎视觉认知机理的图像索引。