论文摘要
在视像概念检测中可以发现,对于同一语义概念而言,其视觉特征的潜在分布通常会随着时间发生变化。针对这种现象,本文将主要研究两个核心问题:第一,不同语义概念在不同条件下随着时间到底有什么变化规律;第二,如何在有限规模训练样本的条件下动态地更新概念模型。论文工作主要包括:1)提出了一套基于有限混合模型的、衡量在线数据潜在分布变化的度量方法,专门研究不同语义概念的潜在分布随时间变化的规律。该度量方法为在线数据流中某语义概念是否发生潜在分布的变化提供了定量的判断依据,也为建立整个在线学习系统提供了较为合理的先验知识。2)提出了监督学习条件下多时间粒度的自适应在线学习算法。该算法主要利用不同语义概念在不同时间粒度上的偏向性,并基于多时间粒度的分类器进行融合。本文着重比较了增量式和平坦式两大类分类器的选择策略,并深入研究了上述度量指标对于该在线学习算法的指导意义。当在线数据流中某语义概念的分布变化相对较快时,可以应用该在线学习算法。3)提出了半监督学习条件下在线优化的增量学习算法。该算法尽可能充分地挖掘大量存在的无类别标签的样本信息,先通过本地自适应步骤得到当前最新的本地概念模型,然后利用最新本地模型动态地更新初始的全局概念模型。该算法在一定条件下解决了半监督学习环境下的模型更新问题。当在线数据流中某语义概念的分布变化相对较慢时,可以应用该在线学习算法。4)实验结果表明,本文提出的这套基于有限混合模型的度量方法,对于在线数据流的语义概念分布特性的描述是有效的,可以为在线学习算法提供相对合理的参考信息,具有一定的普遍意义。基于体育视像和大规模TRECVID视像数据集的实验结果表明,本文提出的两种在线学习算法比同类算法更有效。
论文目录
摘要Abstract第1章 概述1.1 研究目的、意义及背景1.2 机器学习简介1.2.1 学习系统的组成1.2.2 常见学习算法1.2.3 在线学习问题1.3 基于内容的视像概念检测1.3.1 研究现状概述1.3.2 主要研究难点1.3.3 影响概念分类的几个因素1.3.4 基本问题归纳1.4 在线学习模型更新算法1.4.1 启发式策略1.4.2 多分类器方法1.4.3 其他策略1.4.4 小结1.5 本文的研究重点和主要贡献1.6 论文的组织第2章 一个实用的在线体育视像场景检测算法2.1 相关工作介绍2.2 OLSVA算法的主要贡献2.3 棒球视像的鲁棒特征提取2.4 一个监督学习的基线系统2.5 OLSVA算法2.5.1 OLSVA算法流程2.5.2 OLSVA实验和分析2.5.3 OLSVA总结与讨论2.6 OLSVA2算法2.6.1 OLSVA2算法流程2.6.2 OLSVA2实验和分析2.6.3 OLSVA2总结与讨论2.7 本章总结和讨论2.7.1 本章小结2.7.2 讨论第3章 基于FMM的模型序列的度量3.1 研究动机3.2 问题形式化3.3 度量指标定义3.3.1 静态分量属性3.3.2 动态分量属性3.3.3 全局模型属性3.3.4 度量指标小结3.4 现实世界的例子3.4.1 TRECVID数据集3.4.2 几个实际例子3.5 本章小结和讨论第4章 多时间粒度的在线学习算法4.1 研究动机4.2 视像序列的时间粒度4.2.1 两类时间粒度4.2.2 非语义结构的时间粒度4.2.3 多粒度地观测语义概念4.3 MGA算法4.3.1 本地缓冲池4.3.2 分类器选择策略4.3.3 基于自适应权值的分类器融合4.3.4 总结与讨论4.4 MGA实验4.4.1 基本实验环境4.4.2 MGA算法比较4.4.3 数据稳定性分析4.4.4 概念的观测粒度4.5 本章小结与讨论第5章 在线优化的增量学习算法5.1 OOIL概述5.1.1 研究动机5.1.2 基本环境设置5.1.3 主要符号定义5.2 OOIL算法5.2.1 全局模型的预训练5.2.2 本地自适应5.2.3 在线分类5.2.4 全局模型的增量更新5.3 OOIL参数设置5.3.1 参数设置的基本原则5.3.2 基于度量的参数设置5.4 实验与讨论5.4.1 实验一:模拟数据5.4.2 实验二:体育视像数据集5.4.3 实验三:TRECVID数据集5.5 本章小结第6章 结论参考文献致谢附录A 常见的评价指标A.1 查准率,查全率A.2 分类错误数和分类错误率A.3 F度量和F1度量A.4 平均准确率(AP)附录B OLSVA2算法模型池跟踪过程附录C TRECVID数据集C.1 预先标注的20个语义概念C.2 MGA实验的数据预处理C.3 历年数据规模和增长趋势附录D 高斯分量漂移的进一步分析附录E 数据稳定性与系统稳定性附录F MGA算法实际融合的分类器数个人简历、在学期间发表的学术论文与研究成果
相关论文文献
标签:在线学习论文; 基于内容的视像检索论文; 有限混合模型论文; 多时间粒度论文; 视像检索评测论文;