论文摘要
随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增长,视频作为多媒体信息中最复杂一种媒体形式,凭借其多样化的表现形式、丰富的语义内容,以及便捷的记录方式得到了广泛的应用和发展。与此同时,大容量存储技术的发展,使得数字化视频信息存储的代价越来越低,进而促进了数字视频信息的大量产生和堆积。面对越来越多的海量视频库,如何快速有效地进行视频内容分析和检索就成为当前视频信息领域研究的当务之急。针对视频信息检索的需要,本文研究了视频检索中的两个关键技术:视频镜头边界检测及视频片段相似度的度量。在视频边界检测方面,本文主要研究了视频的镜头边界检测及分割。提出了一个多检测器协同工作的镜头边界检测框架,包括应用模糊逻辑理论设计切变边界检测和基于非邻帧差的双阈值渐变边界检测。实验结果表明该框架具有很好的检测效果。在视频片段相似度度量方面,提出了一种新的有效的视频片段的度量方法,方法采用滑动窗口分割相似片段,应用粗集论的等价关系定义了镜头相似类的概念,通过镜头的相似类计算出镜头一一对应关系,用来确定视频片段的相似程度。同时考虑了视频片段相似性的视觉因子、顺序因子和干扰因子的结合,来解决片段相似度的度量问题。实验表明该方法具有较好的效果与鲁棒性。本文最后对工作进行了总结,同时对基于内容的视频检索未来的发展方向提出了自己的见解。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景及意义1.2 基于内容的视频检索简介1.3 国内外的发展动态1.4 论文结构及主要内容第二章 基于内容的视频检索概述及模糊逻辑基础2.1 引言2.2 镜头边界检测2.2.1 镜头边界检测简介2.2.2 镜头边界检测方法的研究进展及现状2.2.3 象素域中镜头边界检测方法2.2.4 压缩域中的镜头边界检测方法2.3 关键帧的提取2.3.1 关键帧基本概念2.3.2 关键帧的选取原则2.4 视频相似度度量2.4.1 图像特征相似度2.4.2 视频片段的相似度2.5 模糊逻辑基础2.5.1 模糊集合2.5.2 模糊推理第三章 镜头边界检测的研究3.1 引言3.2 镜头边界检测框架3.3 基于模糊逻辑的切变边界检测3.3.1 特征的选取3.3.2 切变边界检测3.4 非邻帧差的镜头渐变边界的检测3.5 实验3.5.1 实验数据3.5.2 实验结果3.5.3 实验性能比较3.6 本章小结第四章 视频片段相似性度量的研究4.1 引言4.2 镜头相似度度量4.3 视频片段相似度度量4.3.1 基于滑动镜头窗的视频片段的自动分割4.3.2 确认真正相似的视频片段4.3.3 视频片段的相似度度量因子4.4 实验4.4.1 性能比较4.5 本章小结第五章 总结与展望5.1 总结5.2 展望参考文献致谢攻读学位期间主要的研究成果
相关论文文献
标签:视频片段论文; 镜头边界检测论文; 模糊逻辑论文; 相似性度量论文;