论文摘要
随着多媒体数字化技术的发展和推广、存储成本的降低、网络传输带宽的增长,各种多媒体数据如图像、视频等飞速膨胀逐渐成为信息的主流,并对人们的生活和社会发展产生重要的影响。“语义清晰”是大规模多媒体数据管理的重要前提,因此通过信息技术自动获取多媒体数据对象的语义内容的研究具有十分重要的理论与实践意义,引起了学术界与工业界的高度关注。图像是视频的基础,在多媒体数据管理中占有重要的地位,因此图像语义的自动标注技术是当前相关领域的研究热点。图像语义的自动标注本质上是一个“学习”问题,即根据图像的视觉内容推导出图像的语义标签。因此,各种机器学习、统计推理技术都应用于图像标注的研究中,并在不断的深化和推进。然而,由于图像标注中“语义鸿沟”以及“多标签”问题的影响,现有方法的标注性能仍有待进一步提高。本文围绕图像标注的多标签特点,集中利用多标签相关性,对多标签带来的数据重叠、数据不平衡等问题以及Web图像标注开展研究,在基于生成模型的多标签传递、生成模型与判别分类方法相结合的图像标注、基于噪声训练集的Web图像标注等方面进行了新的尝试,提出多个具有较好性能的图像标注方法。本文主要研究内容如下:1.提出扩展生成模型的图像标注方法:为了有效利用多标签之间的相关性,将原始生成模型扩展为对多标签同时标注,并提出启发式迭代算法进行求解。在该方法中,提出主题-图像-区域多粒度层次特征估计模型,对语义关键词之间的相关性进行分析,并使两者在提出的迭代算法中相互结合共同改进标注性能。实验证明所提基于扩展生成模型的图像标注方法较传统生成模型在标注准确度上有明显改进。2.提出基于可判别超平面树的图像标注方法:基于待标注图像的高视觉生成领域构造局部隐藏主题层次结构,并在其基础上构造可判别超平面树。在引入分类器的判别能力的同时,保留了基于概率模型的图像语义标注的优点,实现将生成模型与判别分类方法相结合改进图像标注。实验证明所提基于可判别超平面树的图像标注方法较之传统生成模型和判别分类模型在标注准确度上有明显提高。3.提出基于局部多标签分类的图像标注方法:给出将生成模型与判别分类技术相结合用于图像标注的另一个解决思路,更深层次的考虑并区分特征相似所隐含的不同语义模式,并对多标签语义特征空间及特征空间的分类边界同时进行考虑,以使生成的隐藏主题同时获得较大的语义和视觉可分性。实验证明所提基于局部多标签分类的图像标注方法较之传统生成模型和判别分类模型在标注准确度上有明显提高。4.提出基于噪声训练集的Web图像标注方法:本文给出一个完整的Web图像标注解决方案。首先提出一个自动生成Web图像标注训练集的“轻量级”方法,进而针对训练集中的噪声数据,设计基于混合模型局部Fisher判别分析的Web图像标注方法。实验表明所提标注方法在存在噪声数据的情况下较传统标注方法获得较好的标注效果。
论文目录
相关论文文献
标签:图像自动标注论文; 多标签学习论文; 统计学习论文; 生成模型论文; 判别分类方法论文; 语义层次结构论文; 超平面树论文; 图像标注论文; 噪声训练集论文;