视频通信中的码率控制与可伸缩编码研究

视频通信中的码率控制与可伸缩编码研究

论文摘要

随着视频编码技术和网络技术的发展,人们对视频通信业务的需求不断增长,视频编码的目标正由传统的存储应用转向网络传输,因此面向网络传输的视频编码技术正受到学术界和工业界越来越多的关注。本论文针对视频通信中视频编码的几个关键技术进行了深入的研究,主要包括码率控制、可伸缩编码以及视频编码算法的DSP优化实现。1、码率控制算法码率控制是视频通信中实现视频高效编码和稳定传输的重要保证。对于恒码率(CBR)控制,针对实时视频通信中视频质量和缓存器状态不稳定的问题,提出了一种鲁棒和自适应的MPEG-4码率控制算法。该算法采用鲁棒的联合PID缓存控制器,根据缓存器状态和图像复杂度来自适应地调整比特数分配,并通过改进的二次码率模型和参数更新方法实现了精确的码率控制,保持了缓存器状态稳定,减少了PSNR波动。针对H.264中DCT系数新的率失真特性,分析得出了精确的基于Cauchy分布的率失真模型,并分别通过Lagrange率失真优化方法和二次RDO编码提出了两种不同复杂度的H.264码率控制算法,实现了更为优化的比特分配和精确的码率控制,并给出了比较实验与分析。对于变码率(VBR)控制,针对ARQ机制下的低延时无线视频传输,提出了一种有效的信道信源联合H.264码率控制算法。该算法用Markov模型作为无线信道模型来估计无线信道的状态和带宽,用基于Cauchy分布的率失真模型作为信源模型,并通过联合信道信源模型进行率失真优化,减少了跳帧,提高了平均PSNR。2、可伸缩视频编码算法可伸缩视频码是解决视频通信中的网络环境异构性和用户需求多样性的重要途径。本文研究了H.264/AVC可伸缩编码模型的关键技术,提出了一种基于运动区域的自适应可伸缩编码的优化实施方案。该方案根据基本层的运动信息及编码模式自动提取图像的运动感兴趣区域,并以独立片的形式对其进行时间、空间和质量上的可伸缩编码,不仅降低了编码复杂度,而且提高了重建图像的质量。另外,针对内容的可伸缩编码,提出了一种基于H.264压缩域的运动对象分割快速分割算法。该算法对H.264压缩域中原始的运动信息通过归一化、时空域联合处理及全局运动补偿得到可靠而显著的对象运动信息,进而采用Mean shift聚类分割算法提取精确的运动对象掩膜,并通过优先块编码实现了基于运动对象的SNR可伸缩编码。实验结果证明,该算法对具有静止背景和运动背景的视频序列都能在满足实时性的要求下,实现准确高效的运动对象分割。在此对象掩膜基础上的SNR可伸缩编码能显著提高对象区域的PSNR性能,提高整幅图像的主观质量。3、视频编码算法优化及DSP实现视频编码算法复杂、数据量大,又具有实时性要求。为了将视频编码算法在DSP上高效实现,针对视频编码算法优化和DSP处理器优化,分别提出了算法级和结构级优化策略。针对基于C64x DSP的MPEG-4编码器优化实现,提出了一种基于自适应终止技术的算法优化方法,该方法通过自适应阈值来减少运动估计中的搜索点和纹理编码计算量,在保持编码质量基本不变的情况下,使计算复杂度得到大幅降低;同时,结合C64x DSP结构特点提出了结构级优化方法,通过增强存储器访问效率和程序并行性来提高编码执行效率,实现了4路CIF视频的MPEG-4实时编码。最后设计实现了基于DM642的无线视频通信系统。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 图索引
  • 表索引
  • 第1章 绪论
  • 1.1 引言
  • 1.2 视频编码的研究背景
  • 1.2.1 视频编码的基本原理和方法
  • 1.2.2 视频编码标准简介
  • 1.2.3 视频通信中视频编码面临的挑战
  • 1.3 论文的研究背景
  • 1.3.1 码率控制
  • 1.3.2 可伸缩视频编码
  • 1.3.3 视频编码算法优化及DSP实现
  • 1.4 论文的主要内容
  • 1.5 论文的结构安排
  • 第2章 CBR码率控制算法研究
  • 2.1 引言
  • 2.2 率失真理论与码率控制
  • 2.2.1 经典率失真模型
  • 2.2.1.1 对数模型
  • 2.2.1.2 指数模型
  • 2.2.1.3 二次模型
  • 2.2.1.4 分段模型
  • 2.2.1.5 线性模型
  • 2.2.2 率失真优化
  • 2.3 经典码率控制算法
  • 2.3.1 TM5码率控制算法
  • 2.3.2 VM8码率控制算法
  • 2.3.3 TMN8码率控制算法
  • 2.3.4 H.264码率控制算法
  • 2.4 面向实时视频通信的MPEG-4码率控制算法
  • 2.4.1 帧层PID码率控制算法
  • 2.4.2 宏块层码率控制算法
  • 2.4.3 帧内编码模式的码率控制
  • 2.4.4 实验结果
  • 2.5 基于Cauchy分布的H.264码率控制算法
  • 2.5.1 基于Cauchy分布的率失真分析
  • 2.5.1.1 基于Cauchy分布的码率模型
  • 2.5.1.2 基于Cauchy分布的失真模型
  • 2.5.2 基于Lagrange率失真优化的码率控制算法
  • 2.5.2.1 Lagrange率失真优化
  • 2.5.2.2 GOP层比特分配
  • 2.5.2.3 帧层比特分配
  • 2.5.2.4 宏块层码率控制
  • 2.5.3 基于二次RDO编码的码率控制算法
  • 2.5.3.1 基于RDO的编码模式选择
  • 2.5.3.2 宏块层码率控制算法
  • 2.5.4 比较实验结果与分析
  • 2.6 本章小结
  • 第3章 VBR码率控制算法研究
  • 3.1 引言
  • 3.2 无线视频传输中的差错控制与码率控制
  • 3.3 差错信道中重传对视频质量的影响
  • 3.4 无线信道模型
  • 3.5 基于时空关系的MAD预测
  • 3.6 信道信源联合的率失真优化
  • 3.7 面向无线信道的码率控制算法
  • 3.7.1 跳帧算法
  • 3.7.2 帧层码率控制算法
  • 3.7.3 宏块层码率控制算法
  • 3.8 实验结果及分析
  • 3.9 本章小结
  • 第4章 可伸缩视频编码算法研究
  • 4.1 引言
  • 4.2 可伸缩视频编码概述
  • 4.2.1 基于MPEG-2的可伸缩视频编码
  • 4.2.2 基于MPEG-4的可伸缩视频编码
  • 4.3 基于H.264/AVC的可伸缩视频编码模型
  • 4.3.1 空间可伸缩性
  • 4.3.2 时间可伸缩性
  • 4.3.2.1 运动补偿时域滤波
  • 4.3.2.2 分级B帧图像编码
  • 4.3.3 质量可伸缩性
  • 4.3.4 H.264/AVC可伸缩编码的无线视频通信应用
  • 4.3.4.1 编码器与通信协议的接口
  • 4.3.4.2 应用举例
  • 4.3.5 H.264/AVC可伸缩视频编码模型性能分析
  • 4.3.6 基于运动区域的自适应选择增强编码
  • 4.3.6.1 运动区域检测
  • 4.3.6.2 选择增强编码
  • 4.3.6.3 实验结果及分析
  • 4.4 基于内容的可伸缩视频编码
  • 4.4.1 基于H.264压缩域的运动对象分割算法
  • 4.4.1.1 H.264压缩域中的运动信息
  • 4.4.1.2 基于Mean shift的时空聚类
  • 4.4.1.3 实验结果及分析
  • 4.4.2 基于运动对象的SNR可伸缩编码
  • 4.4.2.1 优先块编码
  • 4.4.2.2 实验结果及分析
  • 4.5 本章小结
  • 第5章 视频编码算法优化及DSP实现
  • 5.1 引言
  • 5.2 视频编码算法DSP优化策略
  • 5.2.1 算法级优化策略
  • 5.2.2 结构级优化策略
  • 5.3 基于C64x DSP的MPEG-4视频编码算法优化及实现
  • 5.3.1 算法级优化
  • 5.3.1.1 运动估计
  • 5.3.1.2 纹理编码
  • 5.3.2 结构级优化
  • 5.3.2.1 程序结构优化
  • 5.3.2.2 数据存取优化
  • 5.3.2.3 提高代码的并行性
  • 5.3.2.4 一些关键函数优化实现
  • 5.4 实验结果与分析
  • 5.5 基于DM642的MPEG-4视频通信系统设计
  • 5.5.1 系统硬件结构
  • 5.5.2 系统软件结构
  • 5.5.3 系统演示实验
  • 5.6 本章小结
  • 第6章 结论与展望
  • 6.1 全文总结
  • 6.2 工作展望
  • 参考文献
  • 致谢
  • 攻读博士学位期间发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    视频通信中的码率控制与可伸缩编码研究
    下载Doc文档

    猜你喜欢