基于动态阈值与拟合特征的镜头边界检测

基于动态阈值与拟合特征的镜头边界检测

论文摘要

镜头边界检测技术,在视频处理领域中一直以来都占据显著而又重要的地位,从诞生至今受到广大科研工作者的关注。边界检测,用于定位视频数据中的画面发生变换的位置,有切变和渐变这两大类以及识别相应的边界类型。在研究的初期,主要的焦点是放在切变上,而现如今随着该项技术的逐渐成熟,研究的重点开始转移到渐变的检测与识别上。本文提出采用动态阈值和拟合特征相结合的算法,该检测算法不仅能高效地发现切变渐变这两种主流的边界,还能进一步对它们的具体类别进行辨识。检测的第一步是抽取视频数据的特征描述,由于视频数据量庞大,直接在原始数据上开展检测操作显得非常耗时而且低效,为视频生成一个轻量级的表示,有利于快速检测以及方便实验验证。视频帧将按照入:β:λ的比率划分为3×3的小分块,这样每一幅帧将会有九组直方图。然后相邻帧之间的特征组组按照权值矩阵W所设定的系数进行加权平均距离的计算,结果则被认作是帧间相似度,处理完整个序列,则可得到特征描述。本文不使用人工参数,转而采用动态的,通过对影片特征的处理,按照一定的算法计算而来,这样的阈值不需要人工参与,并且能有效地利用数据本身的特性,实际应用中具有较好的适应性。动态阈值在进行切变镜头的检测中,表现优异,且具有极高的稳定性。检测渐变前,精心挑选了一组常规的渐变,然后利用傅里叶函数提取它们的拟合特征,标准化之后,形成了模板边界。这些模板边界将被用来作为检测和识别的依据。利用本文的逆序对算法,从特征描述中筛选待检边界,提取待检边界的特殊表示,再和模板实施对比。那些能够和数据库中的模板边界吻合的,则将它们归类为渐变边界,且它的类型和模板一致,如果没有吻合,那么就直接丢弃。为了进一步加速特征描述的抽取速度,本文采用了基于CUDA-GPU的并行计算框架,将处理高清视频数据的时间缩短到每帧19ms以下,极大地改进了工具的实时性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 基本概念
  • 1.2.1 视频帧
  • 1.2.2 视频镜头
  • 1.2.3 镜头边界类型
  • 1.3 研究概况
  • 1.4 本文工作
  • 1.4.1 研究内容
  • 1.4.2 章节安排
  • 1.5 本章小结
  • 第二章 边界检测概述
  • 2.1 像素比较法
  • 2.2 分块比较法
  • 2.3 直方图法
  • 2.3.1 全局直方图法
  • 2.3.2 局部直方图法
  • 2.4 聚类法
  • 2.5 特征法
  • 2.6 模型驱动法
  • 2.7 本章小结
  • 第三章 镜头边界检测
  • 3.1 本文检测算法概述
  • 3.2 视频特征描述
  • 3.2.1 颜色空间
  • 3.2.2 分块颜色直方图
  • 3.2.3 特征描述
  • 3.3 切变检测
  • 3.4 渐变检测
  • 3.4.1 待检边界
  • 3.4.2 控制函数
  • 3.4.3 拟合特征
  • 3.4.4 渐变检测与识别
  • 3.5 本章小结
  • 第四章 实验结果
  • 4.1 实验数据
  • 4.2 参数设定
  • 4.2.1 分块比率λ:β
  • 4.2.2 权值矩阵W
  • 4.3 检测结果
  • 4.4 本章小结
  • 第五章 原型系统VSDS
  • 5.1 开发环境
  • 5.2 系统详细设计
  • 5.2.1 特征描述
  • 5.2.2 动态阈值检测
  • 5.2.3 交互与展示
  • 5.3 本章小结
  • 第六章 总结与展望
  • 参考文献
  • 科研成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    基于动态阈值与拟合特征的镜头边界检测
    下载Doc文档

    猜你喜欢