基于TI DM6437的H.264 I帧编码器算法优化

基于TI DM6437的H.264 I帧编码器算法优化

论文摘要

在某些视频监控场合,需要在感兴趣目标进入视野时进行高分辨率图像抓拍。最好在尽量廉价的同一硬件平台上实现视频实时压缩和图像准实时压缩这两部分功能。为了提高压缩比和解码端解码器共享,本文选择H.264 I帧编码器作为图像压缩格式。本文优化了DM6437 DSP上的X264 I帧编码器,使其满足准实时性要求。本文首先比较了目前比较先进或流行的图像压缩格式,阐述H.264 I帧对JPEG和JPEG2000的优势;然后详细介绍了DM6437 DSP硬件架构;最后针对编码器工作流程和DSP架构特点从全新角度提出一系列优化手段,并实现。本文创造性的提出了以视频压缩标准帧内压缩模式为大尺寸静态图像压缩标准,很好的解决了速度与资源系消耗的折中,使在同一硬件平台上运行视频实时编码器和大尺寸图像准实时编码器变得容易,同时便于实现解码端视频与图像的解码器共享。本文提出并采用了对DSP上算法优化与以往理论不同角度的理解,对其他算法优化工作也有一定的帮助。经过本文中提到的手段优化, 2048x1024的样本图像压缩时间由26.3秒缩短为5.4秒。且可以在保证图像清晰的前提下提高量化参数(QP),进一步提高速度。准实时目标达成。这说明本文对算法优化的理解是正确而有效的。

论文目录

  • 摘要
  • Abstract
  • 1 引言
  • 2 H.264 帧内压缩格式
  • 2.1 目前流行压缩格式比较
  • 2.1.1 JPEG 压缩原理
  • 2.1.2 JPEG2000 压缩原理
  • 2.1.3 H.264I 帧编码原理
  • 2.1.3.1 数据压缩
  • 2.1.3.2 抗误码抗丢包特性
  • 2.1.3.3 接收端De-block 滤波器
  • 2.2 JPEG、JPEG2000、H.264 Intra 编码器比较
  • 2.2.1 从编码器结构上比较
  • 2.2.2 从使用技术上比较
  • 2.2.3 从实测性能上比较
  • 2.3 比较结论
  • 2.4 H.264 Intra 开源编码器选择
  • 3 TI TMS320DM6437 数字信号处理器
  • 3.1 TMS320DM6437 CPU 构成
  • 3.1.1 综述
  • 3.1.2 DSP CPU 核系统组成及基本功能
  • 3.1.3 运算单元、数据总线、寄存器堆间数据通路
  • 3.1.4 C64x+核硬件流水线
  • 3.1.5 指令与执行单元映射
  • 3.1.6 指令运行周期统计
  • 3.1.7 分级存储结构和 Cache 系统
  • 3.1.7.1 DSP 分级存储结构
  • 3.1.7.2 Cache 工作原理
  • 3.2 C64x+核上程序运行原理
  • 3.2.1 TI 编译器工作过程
  • 3.2.1.1 编译
  • 3.2.1.2 连接
  • 3.2.1.3 分段
  • 3.2.1.4 地址映射
  • 3.2.2 特殊存储器空间:堆(Heap)和栈(Stack)
  • 3.2.2.1 堆
  • 3.2.2.2 栈
  • 4 H.264 Intra mode 在DM6437 上的优化
  • 4.1 传统算法优化手段
  • 4.1.1 传统算法优化的依据
  • 4.1.2 传统算法优化基本工序
  • 4.1.3 传统算法优化的弊端
  • 4.2 本文提出的新算法优化思想
  • 4.2.1 算法总体优化思想---资源平衡
  • 4.2.2 通用DSP 优化手段
  • 4.2.2.1 运算需求与运算单元平衡
  • 4.2.2.2 针对指令集写程序
  • 4.2.2.3 尽量保持软件流水连续
  • 4.2.2.4 内部和外部数据总线读写速度平衡
  • 4.2.2.5 数据的输送节奏与程序运行需求协调
  • 4.2.2.6 Program cache/ram 配置大小与代码量平衡
  • 4.2.2.7 Data cache/ram 配置大小与常用数据块大小和数量相平衡
  • 4.2.2.8 数据使用频繁程度与存放位置相对应
  • 4.2.2.9 使用 Profile 工具
  • 4.2.2.10 使代码风格与优化手段相对应
  • 4.2.2.11 线性汇编优化
  • 4.2.2.12 使用内联函数
  • 4.3 针对 H.264 I 帧编码的优化
  • 4.3.1 程序移植
  • 4.3.1.1 移植手段
  • 4.3.1.2 移植结果
  • 4.3.2 程序流程与内容分析
  • 4.3.3 针对性重点优化手段和策略
  • 4.3.3.1 重点优化循环
  • 4.3.3.2 优化数据存放
  • 5 结果验证
  • 5.1 测试样本选择
  • 5.2 编码参数设置
  • 5.3 优化前后速度比较
  • 5.4 正确性验证
  • 5.5 QP 余量测试
  • 6 结论
  • 参考文献
  • 发表文章目录
  • 致谢
  • 相关论文文献

    标签:;  

    基于TI DM6437的H.264 I帧编码器算法优化
    下载Doc文档

    猜你喜欢