基于CUDA的实时视频运动检测算法研究

基于CUDA的实时视频运动检测算法研究

论文摘要

近年来,在高清视频市场需求的驱使下,出现了多种多样的视频编码格式。这些不同的编码格式之间兼容的关键技术就是视频的去隔行算法。去隔行算法需要通过准确检测视频中的运动才能得到正确的图像。现在主要的运动检测算法包括:基于帧的运动检测算法,基于区域的运动检测算法和基于块的运动检测算法。但是现有的运动检测算法对复杂背景和多区域的视频图像内的运动检测不够理想。而且,这些复杂算法也很难达到视频处理的实时性要求。GPGPU (general purpose computation on GPU,基于GPU的通用计算)的出现为处理高清视频巨大运算量和满足复杂算法的实时性提供了一种可行的方法。相对于CPU, GPU拥有更大的数据传输带宽,更多的计算单元,更强的浮点运算能力。非常适合用于那些具有高度并行特征的计算领域。NVIDIA公司的CUDA(Compute Unified Device Architecture,统一计算架构)技术发布以后,通用算法运算速度得到从几倍到几十倍的增加,甚至得到更大程度的提高。本文结合基于帧、基于区域和基于块的运动检测算法,给出了一种改进的适应上下文的实时视频运动检测算法。该算法不仅能够适应一般的视频运动检测,也可以有效快速的检测复杂的视频输入。首先,通过计算帧间差,并且进行区域分块和宏模块分割。然后,对视频进行高通滤波处理,通过锯齿效应估计、块细节估计、单行检测,得到运动检测的上下文参数。最后,把得到的上下文参数结合低通滤波处理综合进行运动检测。在本文主要完成了以下工作:1)开发高清视频算法仿真平台。该平台基于CUDA架构,并且具备丰富的算法控制和处理接口,方便进行外部算法扩展。2)实现适应上下文的实时视频运动检测算法。并且把算法中拥有大量数据的并行处理部分移植到GPU完成基于CUDA的优化。通过带宽、数据存取和寄存器等优化对CUDA代码进行二次优化。3)进行综合仿真。本文采用的改进算法,不但可以对复杂背景的视频图像准确检测到视频运动,而且适应于多区域复杂视频格式运动检测。经过算法优化,处理时间可以达到22帧每秒,基本达到实时性要求。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题研究背景
  • 1.2 课题的研究意义
  • 1.3 课题的研究现状及其目标
  • 1.4 本文的章节安排
  • 2 CUDA简介
  • 2.1 引言
  • 2.2 CUDA技术的发展
  • 2.3 CUDA编程模型
  • 2.3.1 CUDA内核
  • 2.3.2 CUDA线程层次
  • 2.3.3 CUDA存储器层次结构
  • 2.3.4 GPU编程层次
  • 2.4 CUDA硬件架构
  • 2.6 CUDA性能优化
  • 2.7 本章小结
  • 3 算法开发平台
  • 3.1 算法开发平台简介
  • 3.2 算法开发平台特性
  • 3.3 算法开发平台使用环境
  • 3.3.1 系统配置要求
  • 3.3.2 文件目录配置
  • 3.4 算法开发平台架构介绍
  • 3.4.1 算法开发平台的设计架构
  • 3.4.2 算法开发平台控制流程图
  • 3.5 本章小结
  • 4 适应上下文的运动检测算法
  • 4.1 引言
  • 4.2 本文解决的问题
  • 4.3 关键协议与技术
  • 4.3.1 YUV格式描述
  • 4.3.2 逐行扫描与隔行扫描
  • 4.3.3 视频的场序
  • 4.3.4 视频去隔行
  • 4.3.5 关键协议
  • 4.3.6 视频中的运动
  • 4.4 运动检测器算法描述
  • 4.4.1 luma低通滤波器
  • 4.4.2 luma高通滤波器
  • 4.4.3 锯齿效应估计器
  • 4.4.4 块细节估计
  • 4.4.5 单行检测器
  • 4.4.6 运动相位检测器
  • 4.4.7 块统计滤波器
  • 4.5 本章小结
  • 5 适应上下文的运动检测算法的CUDA仿真
  • 5.1 适应上下文的运动检测算法的程序结构设计
  • 5.2 适应上下文的运动检测算法的UI界面设计
  • 5.3 适应上下文的运动检测算法性能优化
  • 5.4 适应上下文的运动检测算法中基于CUDA的函数设计
  • 5.4.1 低通滤波器的设计
  • 5.4.2 高通滤波器的设计
  • 5.4.3 锯齿效应估计器的设计
  • 5.4.4 块细节估计的设计
  • 5.4.5 单行检测器的设计
  • 5.4.6 运动相位检测器的设计
  • 5.4.7 块统计滤波的设计
  • 5.5 实验仿真结果及其分析
  • 5.5.1 适应上下文的运动检测算法的仿真环境
  • 5.5.2 分步仿真结果
  • 5.5.3 综合仿真结果
  • 5.6 本章小结
  • 6 结论
  • 参考文献
  • 攻读硕士学位期间取得的研究成果
  • 致谢
  • 相关论文文献

    • [1].2019中国医师协会泌尿外科医师分会(CUDA)年会在济南成功召开[J]. 泌尿外科杂志(电子版) 2019(02)
    • [2].基于CUDA的拉普拉斯金字塔的优化[J]. 微型机与应用 2016(10)
    • [3].基于CUDA的三维数据场可视化加速技术研究[J]. 电子技术与软件工程 2015(12)
    • [4].直方图均衡化结合中值滤波的CUDA并行化实现[J]. 计算机与数字工程 2020(05)
    • [5].航天器着陆碰撞动力学CUDA并行计算技术[J]. 航天器工程 2014(01)
    • [6].基于CUDA的各向异性热传导模型的图像修复[J]. 计算机应用研究 2014(06)
    • [7].基于CUDA的图像快速并行细化算法的研究与实现[J]. 电子测量技术 2014(08)
    • [8].CUDA技术及其在数字图像拼接中的应用[J]. 微型机与应用 2013(02)
    • [9].基于八叉树编码的CUDA光线投射算法[J]. 西北大学学报(自然科学版) 2012(01)
    • [10].基于CUDA的图像轮廓提取并行实现[J]. 现代计算机(专业版) 2012(09)
    • [11].基于CUDA的图形处理器FDTD算法仿真研究[J]. 系统仿真学报 2011(04)
    • [12].利用CUDA加速连续波雷达测速算法[J]. 现代电子技术 2011(23)
    • [13].快速不变矩算法基于CUDA的并行实现[J]. 计算机应用 2010(07)
    • [14].基于CUDA的生物序列数据算术编码并行压缩[J]. 计算机应用与软件 2016(12)
    • [15].一种基于CUDA的快速宽视频拼接的方法[J]. 计算机技术与发展 2015(01)
    • [16].基于CUDA和深度置信网络的手写字符识别[J]. 华东理工大学学报(自然科学版) 2015(02)
    • [17].基于CUDA加速的X射线安检机图像处理算法研究[J]. 机电一体化 2015(08)
    • [18].基于CUDA粒子系统的烟花仿真[J]. 计算机应用 2013(07)
    • [19].基于CUDA的矩阵乘法的并行实现[J]. 信息通信 2012(02)
    • [20].地震叠前深度偏移在CUDA平台上的实现[J]. 勘探地球物理进展 2008(06)
    • [21].高斯混合模型盲信号分离方法的CUDA实现[J]. 自动化与信息工程 2013(01)
    • [22].平面单应性矩阵求解的CUDA并行实现[J]. 微型机与应用 2012(23)
    • [23].基于CUDA架构矩阵乘法的研究[J]. 微型机与应用 2011(24)
    • [24].CUDA环境下地形因子的并行计算[J]. 北京测绘 2017(04)
    • [25].CUDA技术在视频压缩中的应用[J]. 硅谷 2009(17)
    • [26].基于CUDA的高速并行均值滤波算法[J]. 咸阳师范学院学报 2013(04)
    • [27].基于CUDA的泥石流模拟计算研究[J]. 计算机工程与设计 2011(12)
    • [28].基于CUDA平台的遗传算法并行实现研究[J]. 计算机工程与科学 2009(S1)
    • [29].基于CUDA快速体数据梯度计算的实时体绘制研究[J]. 兰州交通大学学报 2014(03)
    • [30].基于CUDA的彩色超声血流成像[J]. 计算机应用 2011(03)

    标签:;  ;  ;  

    基于CUDA的实时视频运动检测算法研究
    下载Doc文档

    猜你喜欢