视像概念检测中在线学习算法研究

视像概念检测中在线学习算法研究

论文摘要

在视像概念检测中可以发现,对于同一语义概念而言,其视觉特征的潜在分布通常会随着时间发生变化。针对这种现象,本文将主要研究两个核心问题:第一,不同语义概念在不同条件下随着时间到底有什么变化规律;第二,如何在有限规模训练样本的条件下动态地更新概念模型。论文工作主要包括:1)提出了一套基于有限混合模型的、衡量在线数据潜在分布变化的度量方法,专门研究不同语义概念的潜在分布随时间变化的规律。该度量方法为在线数据流中某语义概念是否发生潜在分布的变化提供了定量的判断依据,也为建立整个在线学习系统提供了较为合理的先验知识。2)提出了监督学习条件下多时间粒度的自适应在线学习算法。该算法主要利用不同语义概念在不同时间粒度上的偏向性,并基于多时间粒度的分类器进行融合。本文着重比较了增量式和平坦式两大类分类器的选择策略,并深入研究了上述度量指标对于该在线学习算法的指导意义。当在线数据流中某语义概念的分布变化相对较快时,可以应用该在线学习算法。3)提出了半监督学习条件下在线优化的增量学习算法。该算法尽可能充分地挖掘大量存在的无类别标签的样本信息,先通过本地自适应步骤得到当前最新的本地概念模型,然后利用最新本地模型动态地更新初始的全局概念模型。该算法在一定条件下解决了半监督学习环境下的模型更新问题。当在线数据流中某语义概念的分布变化相对较慢时,可以应用该在线学习算法。4)实验结果表明,本文提出的这套基于有限混合模型的度量方法,对于在线数据流的语义概念分布特性的描述是有效的,可以为在线学习算法提供相对合理的参考信息,具有一定的普遍意义。基于体育视像和大规模TRECVID视像数据集的实验结果表明,本文提出的两种在线学习算法比同类算法更有效。

论文目录

  • 摘要
  • Abstract
  • 第1章 概述
  • 1.1 研究目的、意义及背景
  • 1.2 机器学习简介
  • 1.2.1 学习系统的组成
  • 1.2.2 常见学习算法
  • 1.2.3 在线学习问题
  • 1.3 基于内容的视像概念检测
  • 1.3.1 研究现状概述
  • 1.3.2 主要研究难点
  • 1.3.3 影响概念分类的几个因素
  • 1.3.4 基本问题归纳
  • 1.4 在线学习模型更新算法
  • 1.4.1 启发式策略
  • 1.4.2 多分类器方法
  • 1.4.3 其他策略
  • 1.4.4 小结
  • 1.5 本文的研究重点和主要贡献
  • 1.6 论文的组织
  • 第2章 一个实用的在线体育视像场景检测算法
  • 2.1 相关工作介绍
  • 2.2 OLSVA算法的主要贡献
  • 2.3 棒球视像的鲁棒特征提取
  • 2.4 一个监督学习的基线系统
  • 2.5 OLSVA算法
  • 2.5.1 OLSVA算法流程
  • 2.5.2 OLSVA实验和分析
  • 2.5.3 OLSVA总结与讨论
  • 2.6 OLSVA2算法
  • 2.6.1 OLSVA2算法流程
  • 2.6.2 OLSVA2实验和分析
  • 2.6.3 OLSVA2总结与讨论
  • 2.7 本章总结和讨论
  • 2.7.1 本章小结
  • 2.7.2 讨论
  • 第3章 基于FMM的模型序列的度量
  • 3.1 研究动机
  • 3.2 问题形式化
  • 3.3 度量指标定义
  • 3.3.1 静态分量属性
  • 3.3.2 动态分量属性
  • 3.3.3 全局模型属性
  • 3.3.4 度量指标小结
  • 3.4 现实世界的例子
  • 3.4.1 TRECVID数据集
  • 3.4.2 几个实际例子
  • 3.5 本章小结和讨论
  • 第4章 多时间粒度的在线学习算法
  • 4.1 研究动机
  • 4.2 视像序列的时间粒度
  • 4.2.1 两类时间粒度
  • 4.2.2 非语义结构的时间粒度
  • 4.2.3 多粒度地观测语义概念
  • 4.3 MGA算法
  • 4.3.1 本地缓冲池
  • 4.3.2 分类器选择策略
  • 4.3.3 基于自适应权值的分类器融合
  • 4.3.4 总结与讨论
  • 4.4 MGA实验
  • 4.4.1 基本实验环境
  • 4.4.2 MGA算法比较
  • 4.4.3 数据稳定性分析
  • 4.4.4 概念的观测粒度
  • 4.5 本章小结与讨论
  • 第5章 在线优化的增量学习算法
  • 5.1 OOIL概述
  • 5.1.1 研究动机
  • 5.1.2 基本环境设置
  • 5.1.3 主要符号定义
  • 5.2 OOIL算法
  • 5.2.1 全局模型的预训练
  • 5.2.2 本地自适应
  • 5.2.3 在线分类
  • 5.2.4 全局模型的增量更新
  • 5.3 OOIL参数设置
  • 5.3.1 参数设置的基本原则
  • 5.3.2 基于度量的参数设置
  • 5.4 实验与讨论
  • 5.4.1 实验一:模拟数据
  • 5.4.2 实验二:体育视像数据集
  • 5.4.3 实验三:TRECVID数据集
  • 5.5 本章小结
  • 第6章 结论
  • 参考文献
  • 致谢
  • 附录A 常见的评价指标
  • A.1 查准率,查全率
  • A.2 分类错误数和分类错误率
  • A.3 F度量和F1度量
  • A.4 平均准确率(AP)
  • 附录B OLSVA2算法模型池跟踪过程
  • 附录C TRECVID数据集
  • C.1 预先标注的20个语义概念
  • C.2 MGA实验的数据预处理
  • C.3 历年数据规模和增长趋势
  • 附录D 高斯分量漂移的进一步分析
  • 附录E 数据稳定性与系统稳定性
  • 附录F MGA算法实际融合的分类器数
  • 个人简历、在学期间发表的学术论文与研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    视像概念检测中在线学习算法研究
    下载Doc文档

    猜你喜欢