论文摘要
基于内容的图像检索(CBIR)是计算机视觉和其它计算机科学领域的研究热点,但图像的低层特征与高层语义之间的巨大语义鸿沟束缚了CBIR的发展。基于支持向量机(SVM)的相关反馈机制被认为是一种可以有效跨越该鸿沟的策略,但这种方法没有利用未标记样本的隐含信息。为更好地利用这些信息,本论文提出将直推式支持向量机(TSVM)作为反馈过程中的学习算法,并在此基础上展开进一步研究,主要包括以下三方面的内容:第一,将TSVM引入到CBIR问题中。相比于SVM,TSVM具有更强的泛化能力,因此TSVM应用于CBIR是可行的;分析图像检索问题的需求,选择非渐进的TSVM逼近算法作为反馈过程中的学习算法;根据TSVM获得较好应用的文本分类问题中所用特征向量的特点,设计了一种颜色稀疏特征,并将其与纹理特征结合。实验结果表明无论选取SVM或TSVM进行学习,本文提出的混合特征在检索效果上都是最好的。第二,将TSVM引入到CBIR的同时也产生了一些新问题,这些问题主要有TSVM的检索结果并没有明显好于SVM,TSVM学习所需的时间远多于SVM,TSVM的分类性能随反馈次数增加没有明显改进。为此引入主动学习和增量学习来解决这些问题。通过主动学习选择分类器置信度最低的样本提供给用户进行标记,通过增量学习可以将用户前几次提供的反馈信息加以利用。以上的改进取得了令人满意的结果,同时也说明TSVM可以在文本分类以外的领域获得良好应用。第三,设计并实现了一个基于TSVM的检索系统。该系统将本论文提出的各种算法集成在一个平台上,既可以作为图像检索的演示系统,也可以作为记录结果的实验平台。
论文目录
相关论文文献
标签:直推式支持向量机论文; 图像检索论文; 相关反馈论文; 特征提取论文;