自适应混合高斯背景建模算法的GPU并行优化研究

自适应混合高斯背景建模算法的GPU并行优化研究

论文摘要

运动目标检测是视频跟踪和分析的基础,其中一个首要而关键的任务是从视频序列中确定运动目标。背景消减法是目前确定运动目标最常用的方法,其核心是将当前包含运动目标的视频帧和一个背景参考帧相差,将其中差值较大的像素区域标记为运动目标。在背景建模各方法中,混合高斯建模方法是公认的检测效果和适应性都较好的方法,但其所需计算量巨大,难以实时实现。图形处理器(GPU)通过大量的流计算单元为加速此类应用提供了新的计算平台,因而针对GPU平台,挖掘背景建模算法的并行性并进行优化,以提高实时性,对于扩展其应用范围和降低应用成本,具有重要意义。通过利用GPU平台上的CUDA编译环境,从线程级并行和异步流处理并行两个方面对自适应混合高斯背景建模算法进行并行化改进。线程级并行化主要是利用CUDA的内核函数(kernel),将原算法里的每一个像素的背景更新过程映射到GPU的一个流处理单元上进行处理,通过多线程的并行执行,来加速计算速度。异步流处理优化借鉴了流计算的边传输边计算的思想,通过隐藏数据传输所带来的时延来加速计算过程。这里利用CUDA编程模型中的流概念,通过创建多个流,使每个流之间的数据传输和计算可以重叠进行,这样就从整体上获得了计算性能的提升,达到了加速的效果。同时,对每个像素的模型参数按照行序优先的规则以分块方式进行组织存放,以配合多流并行处理时内核函数处理数据的需要,保证内核函数能及时存取所需要的数据。在采用了CUDA线程级并行化后,通过对分辨率分别为384×288、640×272、720×576、1280×720和1920×1080的视频进行测试,结果表明,在Debug模式下平均建模时间分别快了40.932ms、94.656ms、228.012ms、547.759ms和861.459ms;而在Release模式下的平均建模时间分别快了10.362ms、33.421ms、71.594ms、173.609ms和156.02ms。在此基础上,以采用8个数据流为参照,进一步进行异步流处理优化后,在Release版本下的测试结果表明:在5种分辨率下,平均建模时间比优化前分别又快了2.640ms、3.769ms、10.703ms、19.331ms和55.335ms。由此可见,在GPU平台上通过线程级并行化和异步流处理优化后,确实可以大幅度地加速混合高斯背景建模算法的执行过程。本文研究工作得到国家自然科学基金项目:嵌入式多媒体流计算的自适应机制与跨层优化(编号:60873029)和华中科技大学自主创新研究基金(编号:2010MS014)的支持。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题的来源、意义和目的
  • 1.2 国内外研究进展情况
  • 1.3 研究内容与结构安排
  • 1.4 本章小结
  • 2 高斯背景建模算法分析与基于GPU 的并行计算
  • 2.1 运动目标检测技术
  • 2.2 高斯背景建模算法分析
  • 2.3 GPU 的体系结构
  • 2.4 CUDA 并行编程模型
  • 2.5 本章小结
  • 3 自适应混合高斯背景建模算法在GPU 上的并行优化
  • 3.1 自适应混合高斯背景建模算法的流程和数据结构
  • 3.2 自适应混合高斯背景建模的GPU 线程并行化
  • 3.3 自适应混合高斯背景建模的CUDA 异步并行优化
  • 3.4 本章小结
  • 4 并行优化的加速结果分析
  • 4.1 实验测试环境
  • 4.2 自适应高斯混合背景建模的线程级并行化测试与分析
  • 4.3 自适应高斯混合背景建模的CUDA 异步并行优化的测试与分析
  • 4.4 自适应高斯混合背景建模基于CPU 多核的并行化测试与分析
  • 4.5 加速测试结果分析
  • 4.6 本章小结
  • 5 总结及展望
  • 5.1 全文总结
  • 5.2 研究展望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].GPU架构的航拍舰船图像拼接算法[J]. 舰船科学技术 2020(06)
    • [2].数字信号相似度方法研究及GPU并行加速[J]. 贵州师范大学学报(自然科学版) 2020(03)
    • [3].基于GPU平台和多源遥感的月度草畜平衡快速评价方法研究[J]. 科技促进发展 2020(Z1)
    • [4].GPU优化的大规模线性方程组并行求解的研究与比较[J]. 信息通信 2016(12)
    • [5].GPU支持的低延迟引力波数据处理[J]. 中国科学:物理学 力学 天文学 2017(01)
    • [6].片上网络良率评估的GPU加速[J]. 浙江大学学报(工学版) 2017(01)
    • [7].基于GPU的图像处理并行算法分析[J]. 中小企业管理与科技(上旬刊) 2017(03)
    • [8].GPU协处理视频编码的服务平台设计[J]. 电脑知识与技术 2016(28)
    • [9].基于GPU的图像处理计算方法分析[J]. 科技风 2017(03)
    • [10].基于GPU的脉冲压缩并行化研究[J]. 航空计算技术 2017(02)
    • [11].基于GPU的图像增强实验设计与实现[J]. 实验技术与管理 2017(05)
    • [12].基于GPU的数字信道化设计[J]. 数字技术与应用 2017(06)
    • [13].基于GPU加速的电力系统静态安全分析研究[J]. 机电信息 2017(27)
    • [14].GPU并行计算分析[J]. 数字通信世界 2017(09)
    • [15].基于双线性插值的图像缩放在GPU上的实现[J]. 微电子学与计算机 2016(11)
    • [16].GPU并行加速的多步逆时偏移在东濮前梨园地区的应用[J]. 物探与化探 2015(01)
    • [17].基于GPU的视频编辑特效技术研究与实现[J]. 科技资讯 2015(12)
    • [18].基于GPU的异构计算技术在超级计算领域的现状及发展展望[J]. 电脑迷 2017(08)
    • [19].瑞士研究人员利用GPU加速的超级计算机模拟宇宙[J]. 中国教育网络 2017(08)
    • [20].一种基于GPU的逆时偏移并行算法[J]. 计算机应用与软件 2013(10)
    • [21].基于GPU并行加速的逆时偏移成像方法[J]. 石油地球物理勘探 2013(05)
    • [22].一种基于GPU的主机接口设计与验证[J]. 航空计算技术 2020(06)
    • [23].局部地形改正快速计算的GPU并行的棱柱法[J]. 测绘学报 2020(11)
    • [24].高性能GPU模拟器的实现[J]. 高技术通讯 2020(06)
    • [25].基于GPU的天基预警雷达信号自适应检测仿真[J]. 计算机仿真 2020(06)
    • [26].未来的汽车需要什么样的GPU?[J]. 单片机与嵌入式系统应用 2018(03)
    • [27].未来的汽车需要什么样的GPU?[J]. 中国集成电路 2018(07)
    • [28].基于GPU的视频序列中运动目标轮廓提取[J]. 电子测量技术 2016(11)
    • [29].基于GPU加速的包络波形反演[J]. 物探化探计算技术 2017(02)
    • [30].基于GPU的高质量隐式曲面四边形化[J]. 计算机辅助设计与图形学学报 2016(04)

    标签:;  ;  ;  ;  ;  

    自适应混合高斯背景建模算法的GPU并行优化研究
    下载Doc文档

    猜你喜欢