基于GPU的H.264并行解码器设计

基于GPU的H.264并行解码器设计

论文摘要

H.264是当今视频压缩领域中压缩性能最优的实用视频编码标准,是由ITU-T与ISO/IEC两大国际标准化组织于2003年共同提出的。H.264拥有以往编码标准无法比拟的性能,但计算复杂度也有所增加,编解码的耗时随之增多。GPU (Graphic Processing Unit,图形处理单元)是显卡的运算核心,具有强大的并行运算能力。近年来GPU逐渐被用于通用计算,将GPU用于视频图像压缩领域具有广阔的应用前景。本文对传统的H.264串行解码模型进行测评,设计了一种基于GPU的H.264并行解码器。该解码器采用CPU+GPU的架构,运用双线程设计,可以实现CPU与GPU的同时高效工作。主线程主要负责调度GPU完成IQ、IDCT、帧内、帧间预测、环路滤波等模块,并负责数据在CPU与GPU之间的传送;子线程则主要在CPU上完成码流分析、熵解码与重排序。本文充分研究了H.264解码中重要且计算耗时的模块,并提出多种能够充分利用模块内数据独立性和GPU资源的并行算法。本文为IDCT提出一种蝶形并行算法和一种增强蝶形并行算法,并提出一种基于左乘转置的直接相乘并行算法;为IQ提出一种并行的实现方法;为帧内预测提出一种固定梯状并行算法和一种自适应梯状并行算法;为帧间预测运用一种高效的MC并行算法;为环路滤波的滤波强度求取环节提出一种并行实现方法和一种简化的滤波强度并行求取算法;并为环路波滤的执行环节提出一种固定梯状并行算法和一种改进的并行滤波算法。通过仿真实验证明,本文提出的CPU+GPU并行解码器能够在有限的硬件条件下,有效地利用GPU并行运算资源和CPU的串行运算资源,大大提高解码速度。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题研究背景
  • 1.2 国内外研究现状
  • 1.3 本文研究内容及结构安排
  • 1.3.1 本文的主要研究内容
  • 1.3.2 本文的章节安排
  • 2 H.264标准与GPU编程概述
  • 2.1 视频标准的发展史
  • 2.2 H.264的解码原理
  • 2.3 H.264解码关键技术
  • 2.4 GPU编程与CUDA架构概述
  • 2.4.1 GPGPU与CUDA
  • 2.4.2 CUDA的编程模型与两级并行架构
  • 2.4.3 CUDA的硬件模型
  • 2.5 CUDA应用于视频压缩领域的优势与挑战
  • 3 基于GPU的H.264并行解码器总体设计
  • 3.1 传统的H.264解码架构测评
  • 3.2 CPU+GPU异构H.264并行解码器架构设计
  • 3.2.1 解码器的CPU+GPU异构模型
  • 3.2.2 解码器的双线程结构设计
  • 3.3 H.264并行解码器实现流程与并行粒度分析
  • 3.4 H.264并行解码器计算复杂度分析
  • 3.4.1 空间复杂度
  • 3.4.2 时间复杂度
  • 3.5 H.264并行解码器的计算瓶颈分析
  • 3.6 本章小结
  • 4 基于GPU的H.264解码器并行算法的设计与实现
  • 4.1 码流分析与重排序的实现
  • 4.2 IDCT与IQ的并行算法设计
  • 4.2.1 基于CPU的IDCT串行算法
  • 4.2.2 蝶形IDCT算法的并行实现
  • 4.2.3 适合GPU运算的并行IDCT算法
  • 4.2.4 IQ的并行算法
  • 4.3 帧内预测并行算法设计
  • 4.3.1 4×4亮度帧内预测的固定梯状并行算法
  • 4.3.2 4×4亮度帧内预测的自适应梯状并行算法
  • 4.3.3 色度帧内预测的固定梯状并行算法
  • 4.4 帧间预测并行算法设计
  • 4.5 环路滤波并行算法设计
  • 4.5.1 滤波强度的并行求取
  • 4.5.2 环路滤波的并行实现
  • 4.5.3 一种改进的环路滤波并行算法
  • 4.5.4 两种环路滤波性能的评价
  • 4.6 本章小结
  • 5 算法仿真与实验结果分析
  • 5.1 四种IDCT并行算法的实验
  • 5.2 IQ并行算法的实验
  • 5.3 帧内预测并行算法的实验
  • 5.4 帧间MC并行算法的实验
  • 5.5 环路滤波并行算法的实验
  • 5.6 解码器总体性能分析
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].GPU架构的航拍舰船图像拼接算法[J]. 舰船科学技术 2020(06)
    • [2].数字信号相似度方法研究及GPU并行加速[J]. 贵州师范大学学报(自然科学版) 2020(03)
    • [3].基于GPU平台和多源遥感的月度草畜平衡快速评价方法研究[J]. 科技促进发展 2020(Z1)
    • [4].GPU优化的大规模线性方程组并行求解的研究与比较[J]. 信息通信 2016(12)
    • [5].GPU支持的低延迟引力波数据处理[J]. 中国科学:物理学 力学 天文学 2017(01)
    • [6].片上网络良率评估的GPU加速[J]. 浙江大学学报(工学版) 2017(01)
    • [7].基于GPU的图像处理并行算法分析[J]. 中小企业管理与科技(上旬刊) 2017(03)
    • [8].GPU协处理视频编码的服务平台设计[J]. 电脑知识与技术 2016(28)
    • [9].基于GPU的图像处理计算方法分析[J]. 科技风 2017(03)
    • [10].基于GPU的脉冲压缩并行化研究[J]. 航空计算技术 2017(02)
    • [11].基于GPU的图像增强实验设计与实现[J]. 实验技术与管理 2017(05)
    • [12].基于GPU的数字信道化设计[J]. 数字技术与应用 2017(06)
    • [13].基于GPU加速的电力系统静态安全分析研究[J]. 机电信息 2017(27)
    • [14].GPU并行计算分析[J]. 数字通信世界 2017(09)
    • [15].基于双线性插值的图像缩放在GPU上的实现[J]. 微电子学与计算机 2016(11)
    • [16].GPU并行加速的多步逆时偏移在东濮前梨园地区的应用[J]. 物探与化探 2015(01)
    • [17].基于GPU的视频编辑特效技术研究与实现[J]. 科技资讯 2015(12)
    • [18].基于GPU的异构计算技术在超级计算领域的现状及发展展望[J]. 电脑迷 2017(08)
    • [19].瑞士研究人员利用GPU加速的超级计算机模拟宇宙[J]. 中国教育网络 2017(08)
    • [20].一种基于GPU的逆时偏移并行算法[J]. 计算机应用与软件 2013(10)
    • [21].基于GPU并行加速的逆时偏移成像方法[J]. 石油地球物理勘探 2013(05)
    • [22].一种基于GPU的主机接口设计与验证[J]. 航空计算技术 2020(06)
    • [23].局部地形改正快速计算的GPU并行的棱柱法[J]. 测绘学报 2020(11)
    • [24].高性能GPU模拟器的实现[J]. 高技术通讯 2020(06)
    • [25].基于GPU的天基预警雷达信号自适应检测仿真[J]. 计算机仿真 2020(06)
    • [26].未来的汽车需要什么样的GPU?[J]. 单片机与嵌入式系统应用 2018(03)
    • [27].未来的汽车需要什么样的GPU?[J]. 中国集成电路 2018(07)
    • [28].基于GPU的视频序列中运动目标轮廓提取[J]. 电子测量技术 2016(11)
    • [29].基于GPU加速的包络波形反演[J]. 物探化探计算技术 2017(02)
    • [30].基于GPU的高质量隐式曲面四边形化[J]. 计算机辅助设计与图形学学报 2016(04)

    标签:;  ;  

    基于GPU的H.264并行解码器设计
    下载Doc文档

    猜你喜欢