基于TILE64的H.264解码器实现与并行研究

基于TILE64的H.264解码器实现与并行研究

论文摘要

随着多媒体业务的快速发展,视频压缩面临着一系列新的需求与压力。为了更好地对视频数据进行传输和存储,新的视频压缩标准相继诞生,如H.263、H.264、MPEG-4等,同时也伴随着更为复杂的编解码算法,这又必然加深了处理器系统的压力。多核处理器为多媒体通信的发展提供了一个有力的平台,基于多核处理器的视频编解码并行研究成为视频通信的研究热点之一。本文基于TILE64众核处理器,通过并行程序设计和汇编指令对H.264解码器进行优化。首先,研究分析了视频编解码的并行研究现状,并对H.264的关键技术和TILE64众核处理器进行了简要介绍,对多核并行程序设计中的关键问题进行了研究。随后,将H.264解码器移植到TILE64众核开发平台,并测试了解码器在单核上运行时的性能。根据测试结果以及对解码器各模块的分析,提出了解码器流水并行的新方法;根据对解码器运动补偿模块的分析,提出了插值并行的方案。随后对并行解码器架构进行了设计和实现。最后,对于分数像素插值模块,使用TILE64的汇编指令对代码进行了优化,提升了代码的性能。通过上述方案,本文实现了基于TILE64众核处理器的H.264并行解码系统。最后的实验结果表明,与串行解码器相比,本文实现的并行解码器可提高40%左右的解码速度,同时保持视频质量的PSNR不变,且主观质量良好。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 本文内容和章节安排
  • 第二章 基于TILE64 的H.264 解码器优化概述
  • 2.1 H.264 标准简介及解码器架构
  • 2.1.1 H.264 关键技术
  • 2.1.2 解码器架构
  • 2.2 TILE64 简介
  • 2.2.1 硬件结构
  • 2.2.2 开发工具
  • 2.3 并行程序设计简介
  • 2.3.1 设计方法
  • 2.3.2 通信机制
  • 2.3.3 性能分析
  • 2.4 基于TILE64 的优化设计
  • 2.5 本章小结
  • 第三章 基于TILE64 的H.264 解码器模块并行实现
  • 3.1 基于TILE64 的串行解码器性能分析
  • 3.1.1 解码器移植
  • 3.1.2 解码器性能分析
  • 3.1.2.1 解码器移植前后性能对比
  • 3.1.2.2 解码器模块分析
  • 3.2 解码器并行设计和实现
  • 3.2.1 串行解码器结构流程分析
  • 3.2.2 流水并行设计思想
  • 3.2.3 流水并行设计及实现
  • 3.3 插值并行设计及实现
  • 3.3.1 运动补偿模块分析
  • 3.3.2 插值并行思想
  • 3.3.3 插值并行实现
  • 3.4 实验结果与分析
  • 3.5 本章小结
  • 第四章 基于TILE64 的H.264 分数像素插值优化
  • 4.1 分数像素插值原理
  • 4.2 采用TILE64 汇编指令的程序优化
  • 4.2.1 TILE64 汇编指令简介
  • 4.2.2 插值函数代码结构
  • 4.2.3 汇编代码优化
  • 4.3 实验结果与性能分析
  • 4.4 本章小结
  • 第五章 总结与展望
  • 5.1 全文总结
  • 5.2 工作展望
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  

    基于TILE64的H.264解码器实现与并行研究
    下载Doc文档

    猜你喜欢