论文摘要
随着视频编码技术和网络技术的发展,人们对视频通信业务的需求不断增长,视频编码的目标正由传统的存储应用转向网络传输,因此面向网络传输的视频编码技术正受到学术界和工业界越来越多的关注。本论文针对视频通信中视频编码的几个关键技术进行了深入的研究,主要包括码率控制、可伸缩编码以及视频编码算法的DSP优化实现。1、码率控制算法码率控制是视频通信中实现视频高效编码和稳定传输的重要保证。对于恒码率(CBR)控制,针对实时视频通信中视频质量和缓存器状态不稳定的问题,提出了一种鲁棒和自适应的MPEG-4码率控制算法。该算法采用鲁棒的联合PID缓存控制器,根据缓存器状态和图像复杂度来自适应地调整比特数分配,并通过改进的二次码率模型和参数更新方法实现了精确的码率控制,保持了缓存器状态稳定,减少了PSNR波动。针对H.264中DCT系数新的率失真特性,分析得出了精确的基于Cauchy分布的率失真模型,并分别通过Lagrange率失真优化方法和二次RDO编码提出了两种不同复杂度的H.264码率控制算法,实现了更为优化的比特分配和精确的码率控制,并给出了比较实验与分析。对于变码率(VBR)控制,针对ARQ机制下的低延时无线视频传输,提出了一种有效的信道信源联合H.264码率控制算法。该算法用Markov模型作为无线信道模型来估计无线信道的状态和带宽,用基于Cauchy分布的率失真模型作为信源模型,并通过联合信道信源模型进行率失真优化,减少了跳帧,提高了平均PSNR。2、可伸缩视频编码算法可伸缩视频码是解决视频通信中的网络环境异构性和用户需求多样性的重要途径。本文研究了H.264/AVC可伸缩编码模型的关键技术,提出了一种基于运动区域的自适应可伸缩编码的优化实施方案。该方案根据基本层的运动信息及编码模式自动提取图像的运动感兴趣区域,并以独立片的形式对其进行时间、空间和质量上的可伸缩编码,不仅降低了编码复杂度,而且提高了重建图像的质量。另外,针对内容的可伸缩编码,提出了一种基于H.264压缩域的运动对象分割快速分割算法。该算法对H.264压缩域中原始的运动信息通过归一化、时空域联合处理及全局运动补偿得到可靠而显著的对象运动信息,进而采用Mean shift聚类分割算法提取精确的运动对象掩膜,并通过优先块编码实现了基于运动对象的SNR可伸缩编码。实验结果证明,该算法对具有静止背景和运动背景的视频序列都能在满足实时性的要求下,实现准确高效的运动对象分割。在此对象掩膜基础上的SNR可伸缩编码能显著提高对象区域的PSNR性能,提高整幅图像的主观质量。3、视频编码算法优化及DSP实现视频编码算法复杂、数据量大,又具有实时性要求。为了将视频编码算法在DSP上高效实现,针对视频编码算法优化和DSP处理器优化,分别提出了算法级和结构级优化策略。针对基于C64x DSP的MPEG-4编码器优化实现,提出了一种基于自适应终止技术的算法优化方法,该方法通过自适应阈值来减少运动估计中的搜索点和纹理编码计算量,在保持编码质量基本不变的情况下,使计算复杂度得到大幅降低;同时,结合C64x DSP结构特点提出了结构级优化方法,通过增强存储器访问效率和程序并行性来提高编码执行效率,实现了4路CIF视频的MPEG-4实时编码。最后设计实现了基于DM642的无线视频通信系统。
论文目录
摘要Abstract目录图索引表索引第1章 绪论1.1 引言1.2 视频编码的研究背景1.2.1 视频编码的基本原理和方法1.2.2 视频编码标准简介1.2.3 视频通信中视频编码面临的挑战1.3 论文的研究背景1.3.1 码率控制1.3.2 可伸缩视频编码1.3.3 视频编码算法优化及DSP实现1.4 论文的主要内容1.5 论文的结构安排第2章 CBR码率控制算法研究2.1 引言2.2 率失真理论与码率控制2.2.1 经典率失真模型2.2.1.1 对数模型2.2.1.2 指数模型2.2.1.3 二次模型2.2.1.4 分段模型2.2.1.5 线性模型2.2.2 率失真优化2.3 经典码率控制算法2.3.1 TM5码率控制算法2.3.2 VM8码率控制算法2.3.3 TMN8码率控制算法2.3.4 H.264码率控制算法2.4 面向实时视频通信的MPEG-4码率控制算法2.4.1 帧层PID码率控制算法2.4.2 宏块层码率控制算法2.4.3 帧内编码模式的码率控制2.4.4 实验结果2.5 基于Cauchy分布的H.264码率控制算法2.5.1 基于Cauchy分布的率失真分析2.5.1.1 基于Cauchy分布的码率模型2.5.1.2 基于Cauchy分布的失真模型2.5.2 基于Lagrange率失真优化的码率控制算法2.5.2.1 Lagrange率失真优化2.5.2.2 GOP层比特分配2.5.2.3 帧层比特分配2.5.2.4 宏块层码率控制2.5.3 基于二次RDO编码的码率控制算法2.5.3.1 基于RDO的编码模式选择2.5.3.2 宏块层码率控制算法2.5.4 比较实验结果与分析2.6 本章小结第3章 VBR码率控制算法研究3.1 引言3.2 无线视频传输中的差错控制与码率控制3.3 差错信道中重传对视频质量的影响3.4 无线信道模型3.5 基于时空关系的MAD预测3.6 信道信源联合的率失真优化3.7 面向无线信道的码率控制算法3.7.1 跳帧算法3.7.2 帧层码率控制算法3.7.3 宏块层码率控制算法3.8 实验结果及分析3.9 本章小结第4章 可伸缩视频编码算法研究4.1 引言4.2 可伸缩视频编码概述4.2.1 基于MPEG-2的可伸缩视频编码4.2.2 基于MPEG-4的可伸缩视频编码4.3 基于H.264/AVC的可伸缩视频编码模型4.3.1 空间可伸缩性4.3.2 时间可伸缩性4.3.2.1 运动补偿时域滤波4.3.2.2 分级B帧图像编码4.3.3 质量可伸缩性4.3.4 H.264/AVC可伸缩编码的无线视频通信应用4.3.4.1 编码器与通信协议的接口4.3.4.2 应用举例4.3.5 H.264/AVC可伸缩视频编码模型性能分析4.3.6 基于运动区域的自适应选择增强编码4.3.6.1 运动区域检测4.3.6.2 选择增强编码4.3.6.3 实验结果及分析4.4 基于内容的可伸缩视频编码4.4.1 基于H.264压缩域的运动对象分割算法4.4.1.1 H.264压缩域中的运动信息4.4.1.2 基于Mean shift的时空聚类4.4.1.3 实验结果及分析4.4.2 基于运动对象的SNR可伸缩编码4.4.2.1 优先块编码4.4.2.2 实验结果及分析4.5 本章小结第5章 视频编码算法优化及DSP实现5.1 引言5.2 视频编码算法DSP优化策略5.2.1 算法级优化策略5.2.2 结构级优化策略5.3 基于C64x DSP的MPEG-4视频编码算法优化及实现5.3.1 算法级优化5.3.1.1 运动估计5.3.1.2 纹理编码5.3.2 结构级优化5.3.2.1 程序结构优化5.3.2.2 数据存取优化5.3.2.3 提高代码的并行性5.3.2.4 一些关键函数优化实现5.4 实验结果与分析5.5 基于DM642的MPEG-4视频通信系统设计5.5.1 系统硬件结构5.5.2 系统软件结构5.5.3 系统演示实验5.6 本章小结第6章 结论与展望6.1 全文总结6.2 工作展望参考文献致谢攻读博士学位期间发表的学术论文
相关论文文献
标签:视频通信论文; 视频编码论文; 码率控制论文; 率失真优化论文; 可伸缩编码论文; 感兴趣区域论文; 运动对象分割论文; 优化论文;