面向结构化数据的视频检索研究

面向结构化数据的视频检索研究

论文摘要

视频数据在近几年呈现出爆炸式的增长,在人们的日常生活中占据越来越重要的地位,而视频分享在未来数年甚至数十年也都将会是热点,这使得视频内容分析以及视频检索成为当前视频研究领域的重点。基于内容的视频检索(CBVR)是一项集理论性、实用性和挑战性为一体的技术,经过十几年的研究,取得了巨大的进展,已经有一些原型系统开发出来,并在小型商用搜索引擎中使用。在CBVR中,广义的视频结构化起着非常关键的作用。由于原始视频为无结构的数据流,在检索时首先需要采用合适的模型将视频组织为结构化数据,并根据结构化的组织形式对视频进行分析、索引与查询。本文的主要工作目标是研究视频的数据结构化特性,并充分利用其结构特性设计高效的机器学习算法用于高层语义理解,能够自动地或以较少的人工参与缩小底层特征与高层语义之间的“语义鸿沟”,最终改善视频检索的性能。本文以视频的结构为主线,分别从图像层次结构、镜头层次结构和场景层次结构进行研究,提出在这些层次结构下的机器学习算法。本文的主要工作和创新点总结如下:1.针对基于全局信息的图像层检索,提出采用AdaBoost方法与SVM相结合进行多次样本抽样,将分类精度作为特征性能的判据进行特征选择,选取少量有利于检索的特征,将弱分类器增强为强分类器,从而较好的融合多种特征。2.对基于区域信息的图像层检索,采用多示例学习进行建模,并利用多示例主动学习以减少人工标注的工作量,解决标注样本缺乏问题。文中详细分析多示例主动学习的特点,归纳为包层、示例层和混合层次三种主动学习模式;针对包层多示例主动学习问题,提出一种结合示例数目统计特征和不确定性的样本选择策略,实验验证了该方法的有效性。3.镜头是视频的基本物理单元,因此视频检索通常都是在镜头级别进行。本文分析视频本身所具有的多层次结构特性,首次提出多层次多示例学习框架,该框架结合了结构学习和多示例学习的特点,能对视频内容有效建模。文中探讨多层次多示例学习需要解决的关键问题,并针对这些问题设计多个算法构成一个完整的框架。本文首先设计多层次多示例核来度量这种特定结构下样本的相似度;然后利用边缘化核的思想对多层次多示例核进行改进得到边缘化多层次多示例核,解决示例贡献的权重问题;继而提出多层次多示例正则化框架,引入多重约束显式地表达多层次结构和多示例关系特性,最终较好地解决了多层次多示例学习问题。4.场景是视频中的语义单元,比镜头具有更高的抽象和概括能力,在视频语义理解时有效地结合场景信息将对视频检索、管理等语义级应用提供支持。本文提出一种将全局分布特性和局部相似性约束结合的基于能量最小化的方法进行场景分割(EMS);同时,提出一种将场景分割结果与自动语音识别(ASR)结果融合的方法用于视频检索中,得到更加优异的性能。

论文目录

  • 摘要
  • Abstract
  • 图目录
  • 表目录
  • 第一章 绪论
  • 1.1 视频检索研究的意义
  • 1.2 国内外研究现状
  • 1.3 基于内容的视频检索框架
  • 1.3.1 视频标注研究现状
  • 1.3.2 技术难点及存在的问题
  • 1.4 本文研究内容与创新点
  • 第二章 视频结构化和特征提取
  • 2.1 视频结构化
  • 2.1.1 镜头边界检测
  • 2.1.2 关键帧提取
  • 2.1.3 关键区域分割
  • 2.1.4 场景边界检测
  • 2.2 视频底层特征提取
  • 2.2.1 颜色特征
  • 2.2.2 纹理特征
  • 2.2.3 形状特征
  • 2.2.4 摄像机运动特征
  • 2.3 视频高层特征提取
  • 2.3.1 高斯混合模型(GMM)
  • 2.3.2 支持向量机(SVM)
  • 2.4 本章总结
  • 第三章 基于图像结构的检索
  • 3.1 引言
  • 3.2 基于特征选择的检索方法
  • 3.2.1 AdaBoost-SVM
  • 3.2.2 实验结果
  • 3.3 多示例主动学习
  • 3.3.1 包层主动学习
  • 3.3.2 示例层主动学习
  • 3.3.3 混合层次主动学习
  • 3.4 基于包层多示例主动学习的检索
  • 3.4.1 基于包特征重构的包层分类器构造
  • 3.4.2 样本主动选择策略
  • 3.5 实验及分析
  • 3.6 本章小结
  • 第四章 基于镜头结构的检索
  • 4.1 引言
  • 4.2 多层次多示例学习问题
  • 4.3 多层次多示例核
  • 4.3.1 多层次多示例核
  • 4.3.2 基于多层次多示例核的概念检测
  • 4.4 边缘多层次多示例核
  • 4.4.1 边缘核
  • 4.4.2 边缘多层次多示例核
  • 4.4.3 条件概率p(h|T)的计算
  • 4.5 多层次多示例学习正则化框架
  • FLPE方法'>4.5.1 约束A+B: MLMIFLPE方法
  • 2方法'>4.5.2 约束A+C: MILC2方法
  • 4.5.3 CCCP方法求解
  • 4.6 实验和分析
  • 4.6.1 数据集
  • 4.6.2 评价指标
  • 4.6.3 实验设置
  • 4.6.4 结果与分析
  • 4.7 本章小结
  • 第五章 基于场景结构的检索
  • 5.1 引言
  • 5.2 基于能量最小化的场景分割算法(EMS)
  • 5.2.1 支配簇(Dominant Cluster)
  • 5.2.2 能量最小化分割(EMS)
  • 5.3 场景分割实验及分析
  • 5.3.1 数据集与实验设置
  • 5.3.2 家用视频场景分割实验
  • 5.3.3 商业视频场景分割实验
  • 5.3.4 EMS鲁棒性测试
  • 5.4 结合场景结构信息的视频检索
  • 5.5 结合场景的视频检索实验
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 本文研究内容回顾
  • 6.2 研究工作展望
  • 参考文献
  • 致谢
  • 攻读博士学位期间的研究成果
  • 相关论文文献

    • [1].基于内容的视频检索与挖掘关键技术研究[J]. 软件 2014(08)
    • [2].视频检索的专利技术[J]. 中国新通信 2018(19)
    • [3].一种基于内容的视频检索系统设计[J]. 科技创新与应用 2015(01)
    • [4].网络视频检索的用户信息行为研究[J]. 图书情报工作 2013(08)
    • [5].基于内容的视频检索[J]. 电脑知识与技术 2008(S1)
    • [6].视频检索研究可视化分析[J]. 计算机工程与应用 2017(22)
    • [7].基于内容的体育视频检索系统设计与实现[J]. 西藏科技 2013(06)
    • [8].文化遗产视频检索系统的研究与实现[J]. 计算机工程 2008(10)
    • [9].图像与视频检索新发展与急需解决的科学问题[J]. 国际学术动态 2011(02)
    • [10].基于内容的视频检索技术综述[J]. 科技经济导刊 2019(02)
    • [11].基于内容的视频检索系统设计与实现[J]. 电子技术与软件工程 2019(04)
    • [12].音视频检索系统的研究与实现[J]. 数字传媒研究 2018(11)
    • [13].基于深度学习的视频检索系统设计与实现[J]. 计算机测量与控制 2019(06)
    • [14].基于特征提取视频检索方案设计与实现[J]. 广播电视信息 2018(S1)
    • [15].基于内容的视频检索研究进展[J]. 智慧工厂 2018(10)
    • [16].基于视觉词袋的视频检索校准方法[J]. 图学学报 2016(01)
    • [17].基于内容的视频检索关键技术探究[J]. 科技信息 2010(17)
    • [18].视频检索在汉字识别中的应用研究[J]. 计算机技术与发展 2010(10)
    • [19].基于内容的静态语义概念视频检索方法研究[J]. 微计算机信息 2012(03)
    • [20].基于概念的视频检索中概念语义匹配算法研究[J]. 泰山学院学报 2011(06)
    • [21].视频检索专利技术分析[J]. 河南科技 2015(24)
    • [22].基于稀疏自动编码器的近重复视频检索[J]. 电子技术与软件工程 2017(03)
    • [23].一种快速有效的相似视频检索方法[J]. 中国科学院研究生院学报 2010(03)
    • [24].基于多模态概念关联图的视频检索[J]. 计算机辅助设计与图形学学报 2010(05)
    • [25].基于MPEG-7视频检索系统的设计与实现[J]. 西北大学学报(自然科学版) 2018(03)
    • [26].视频检索在中国的专利状况分析[J]. 电视技术 2013(S2)
    • [27].基于多属性层次识别的车辆视频检索系统设计研究[J]. 电脑与电信 2017(07)
    • [28].智能视频分析在海量视频检索中的作用[J]. 中国公共安全 2013(16)
    • [29].基于语义的视频检索关键技术综述[J]. 电子科技 2012(08)
    • [30].基于内容的视频检索技术[J]. 福建电脑 2008(09)

    标签:;  ;  ;  ;  ;  ;  

    面向结构化数据的视频检索研究
    下载Doc文档

    猜你喜欢