论文摘要
镜头边界检测技术,在视频处理领域中一直以来都占据显著而又重要的地位,从诞生至今受到广大科研工作者的关注。边界检测,用于定位视频数据中的画面发生变换的位置,有切变和渐变这两大类以及识别相应的边界类型。在研究的初期,主要的焦点是放在切变上,而现如今随着该项技术的逐渐成熟,研究的重点开始转移到渐变的检测与识别上。本文提出采用动态阈值和拟合特征相结合的算法,该检测算法不仅能高效地发现切变渐变这两种主流的边界,还能进一步对它们的具体类别进行辨识。检测的第一步是抽取视频数据的特征描述,由于视频数据量庞大,直接在原始数据上开展检测操作显得非常耗时而且低效,为视频生成一个轻量级的表示,有利于快速检测以及方便实验验证。视频帧将按照入:β:λ的比率划分为3×3的小分块,这样每一幅帧将会有九组直方图。然后相邻帧之间的特征组组按照权值矩阵W所设定的系数进行加权平均距离的计算,结果则被认作是帧间相似度,处理完整个序列,则可得到特征描述。本文不使用人工参数,转而采用动态的,通过对影片特征的处理,按照一定的算法计算而来,这样的阈值不需要人工参与,并且能有效地利用数据本身的特性,实际应用中具有较好的适应性。动态阈值在进行切变镜头的检测中,表现优异,且具有极高的稳定性。检测渐变前,精心挑选了一组常规的渐变,然后利用傅里叶函数提取它们的拟合特征,标准化之后,形成了模板边界。这些模板边界将被用来作为检测和识别的依据。利用本文的逆序对算法,从特征描述中筛选待检边界,提取待检边界的特殊表示,再和模板实施对比。那些能够和数据库中的模板边界吻合的,则将它们归类为渐变边界,且它的类型和模板一致,如果没有吻合,那么就直接丢弃。为了进一步加速特征描述的抽取速度,本文采用了基于CUDA-GPU的并行计算框架,将处理高清视频数据的时间缩短到每帧19ms以下,极大地改进了工具的实时性。