基于采样模型的多维矢量矩阵DCT整数变换编解码器研究

基于采样模型的多维矢量矩阵DCT整数变换编解码器研究

论文摘要

近年来,随着计算机技术和网络技术的发展,多媒体的应用已深入到我们生活的各个方面,为用户提供多媒体服务已经成为通信领域和计算机领域必然的技术发展趋势。与其它传统数据应用相比,多媒体应用最突出的特点是集成了音频、视频等多种类型的媒体流,而数字化后的音、视频流具有庞大的信息量,这给视频信息的存储和传输带来严峻的挑战。虽然当前计算机硬件水平发展很快,但仍无法满足对视频信息的处理要求。即使计算机运算速度和存储空间在某些情况下能够满足处理数字化视频信息的要求,如果直接对未压缩的原始数据进行处理,数据中的冗余信息对计算机硬件和网络带宽都会造成浪费。所以必须对数字视频信息进行压缩以提高效率,节省资源。因此,视频压缩编码技术一直是相关领域的永久性研究热点。彩色视频是由时间上连续的彩色图像序列组成,这些图像序列在空间域的行列之间、颜色域的色彩分量之间、时间域的前后时间点之间存在着很强的相关性,这些相关性表示彩色视频的内部存在着大量的冗余信息,需要运用数学方法去除冗余实现视频信号的压缩编码。多维矢量矩阵理论利用彩色视频图像在时域、空域及颜色分量上的相关性,如同魔方游戏运算规则一样把对彩色视频多个帧的处理统一起来,转化为对空间多维变换的数学处理,全面去除彩色视频中的相关性,从而实现高信噪比条件下的高倍压缩。以陈贺新教授为核心的课题组近年来一直致力于多维变换模型的研究,提出了多维矩阵理论,并对其不断地丰富和发展,在图像压缩和视频压缩领域都取得了显著的成就。课题组先后提出了三维矩阵变换压缩编码和三维矩阵宽离散余弦变换,并将其应用于彩色图像的压缩编码。由于前期定义的多维矩阵理论在乘法的定义方面涉及到多种不同类型的乘法规则,不利于实际应用,本研究小组近年创新的提出了多维矢量矩阵理论,解决了不同维数不同阶数之间的乘法问题,更加丰富了多维矩阵理论。本文在这个理论基础上深入研究多维矢量矩阵理论在视频压缩方面的应用。本文以国家自然科学基金项目“彩色视频流的多维矢量矩阵正交变换编解码器研究”和国家自然科学基金国际合作项目“基于音频嵌入视频方式同步视频编码的普适计算”为依托,分析了目前流行的图像、视频压缩编码技术和多维信息处理技术在图像和视频处理领域的应用,并对多维矢量矩阵编解码器中的多维矢量矩阵整数变换,多维标量量化和扫描,多维模型的建立等问题进行了系统的、较为全面的研究,为进一步构建更加有效的编解码器奠定基础。离散余弦变换(DCT)的变换性能在所有次优变换中最优,能极大地去除图像元素在变换域中的相关性,在图像和视频编码领域得到了广泛的应用。但由于DCT的变换矩阵是用浮点数表示,运算量大,占用系统资源多,同时易产生数据漂移。整数变换能够解决数据漂移和编码效率低的问题。整数变换是用整数矩阵代替DCT的浮点数变换矩阵,这样变换过程完全是整数运算,保证了编码的可逆性;同时整数乘法可用加减法和位移代替,因此变换过程可以完全通过加减法和位移实现,运算量大幅度减少。本文利用H.264中二维整数变换的实现方法,结合四维矩阵离散余弦变换的特点,提出了四维矩阵离散余弦变换从整数到整数的可逆变换方法,并证明了四维矢量矩阵整数核算子的正交性和能量集中性。最后将整数核算子用于彩色视频流的压缩,通过具体的例子证明了该方法的可行性,得到了很好的结果。结果表明在压缩比相同的情况下解码视频的信噪比本文的算法优于国际标准H.264/AVC,和浮点数变换的结果相当。本文在前期对多维矢量矩阵正交变换编码进行了深入的研究,得到了性能优良的正交变换矢量整数矩阵,用于视频编码后取得了良好的压缩效果。但是由于变换编码后系数的处理一直采用的是基于矢量量化的方法,对码书的依赖性比较大,不利于视频编码的广泛应用和跟国际标准的兼容,为此本文统计了多维矢量矩阵DCT整数变换(MD-VMICT)后直流系数和交流系数的分布特点,根据统计特性提出了适用于MD-VMICT编解码器的多维量化方法和扫描方法。本文提出了一种指数量化方式,为了能够运用移位操作代替除法,修正量化公式为2的指数函数。扫描方法根据统计特性修改zigzag的扫描方式。最后通过实验确定量化器的参数设置,并与参考文献和H.264/AVC, MPEG4,进行了比较。实验结果表明本文方法优于参考文献和MPEG4,和最新的国际标准性能相当,并在低比特率条件下表现出优势,同时本文方法有较高的适应性,能够与现行的标准兼容。多维矢量矩阵理论要求对视频数据进行多维矢量划分,如何有效的表达多维矢量,找到各个分量之间的相关性是后续正交整数变换的基础。我们前期已经建立了三维模型,利用各个颜色分量的行、列、时间进行三维建模,并进行合理的分块划分,分别进行多维矩阵乘法的正交变换,取得了比较好的压缩效果,在此基础上继续研究四维建模方法,把一帧的视频数据按特定模型扫描的方式进行采样,则可构成空间的行、列、场和时间的帧四维超立方体模型,更有效的去除时间、空间相关性。本文提出了堆积模型和采样模型两种四维模型,更有效的去除隐藏在四邻域像素之间的相关性以及行、列、时间维度上的相关性。经过四维建模后,改进本文前一章的量化和扫描算法,用于四维矢量矩阵视频压缩编解码器,最后进行熵编码进一步消除统计冗余。最后的实验结果表明本文提出的四维模型能更有效的去除像素之间的冗余,同时采样模型的主观质量要好于堆积模型。采样模型细节处的数字边缘块效应要明显少于堆积模型,这也证明了采样模型在去除邻域像素的相关性同时保证图像清晰度方面有更大的优势。本文提出了三维矢量矩阵DCT整数变换编解码器和四维矢量矩阵DCT整数变换编解码器模型,扩展了多维矢量矩阵理论在彩色视频压缩编码领域的应用。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 图像和视频压缩编码的发展及研究现状
  • 1.2 论文的研究现状
  • 1.3 论文的结构安排
  • 第2章 图像和视频压缩编码理论基础及标准
  • 2.1 图像压缩编码的一般过程
  • 2.2 图像和视频信号的统计特性和模型
  • 2.2.1 信息论基础
  • 2.2.2 率失真函数
  • 2.2.3 图像信号统计模型
  • 2.3 编码方法的分类
  • 2.3.1 一阶自回归模型
  • 2.3.2 预测编码
  • 2.3.3 变换编码
  • 2.3.4 量化编码
  • 2.3.5 熵编码
  • 2.4 图像和视频编码标准
  • 2.4.1 静止图像压缩标准
  • 2.4.2 运动图像压缩标准
  • 2.5 图像和视频压缩质量评价标准
  • 2.5.1 图像质量的主观评价
  • 2.5.2 图像质量的客观评价
  • 第3章 多维矢量矩阵理论
  • 3.1 多维矢量矩阵定义
  • 3.2 多维矢量矩阵基本运算准则
  • 3.3 多维矢量矩阵正交变换
  • 3.4 四维矢量DCT操作算子
  • 第4章 四维矢量矩阵离散余变换的整数实现
  • 4.1 多维矢量矩阵离散余弦正交变换定义
  • 4.2 四维矢量矩阵离散余弦变换(4D-VMDCT)的整数实现
  • 4.3 四维矢量DCT整数变换的正交性
  • 4.4 四维矢量DCT整数操作算子的能量集中性
  • 4.5 四维矢量DCT整数操作算子与浮点数比较
  • 4.6 实验结果及分析
  • 4.7 本章小结
  • 第5章 多维矢量矩阵离散余弦整数变换的量化和扫描方法
  • 5.1 彩色视频的多维矢量矩阵DCT整数编解码器
  • 5.2 CUBE的直流系数分布特点
  • 5.3 CUBE的交流系数分布特点
  • 5.4 彩色视频的多维量化器设计
  • 5.5 彩色视频的多维扫描
  • 5.6 多维矢量矩阵ICT编解码器的熵编码
  • 5.7 实验结果及分析
  • 5.8 本章小结
  • 第6章 基于四维矢量矩阵采样模型的整数编解码器
  • 6.1 彩色视频四维矢量矩阵模型建模
  • 6.2 四维矢量矩阵ICT编解码器框图
  • 6.3 改进的量化、扫描和编码
  • 6.4 实验结果及分析
  • 6.5 本章小结
  • 第7章 总结与展望
  • 7.1 全文总结
  • 7.2 下一步工作的展望
  • 参考文献
  • 作者简介及在学期间所取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].基于DCT和稀疏表示的人脸识别[J]. 科技展望 2014(16)
    • [2].DCT算术编码在图象压缩中的应用[J]. 西南民族大学学报(自然科学版) 2015(01)
    • [3].基于DCT域数字水印原理及算法分析[J]. 山西师范大学学报(自然科学版) 2014(S2)
    • [4].中华鳖dct基因克隆及表达分析[J]. 河北大学学报(自然科学版) 2019(06)
    • [5].基于DCT算法的视频数字水印的研究与实现[J]. 大学教育 2016(12)
    • [6].DCT变换域的数字水印技术研究[J]. 电子世界 2013(10)
    • [7].基于DCT的探地雷达频率波数偏移优化算法[J]. 电子科技大学学报 2012(01)
    • [8].基于DCT的数字水印鲁棒性研究[J]. 办公自动化 2010(04)
    • [9].一种基于DCT的地理数据版权保护方法[J]. 石河子大学学报(自然科学版) 2010(04)
    • [10].基于DCT和线性判别分析的人脸识别[J]. 电子学报 2009(10)
    • [11].一种新的基于DCT变换的线性判别分析[J]. 计算机技术与发展 2008(06)
    • [12].DCT域基于免疫算法的视频水印技术[J]. 计算机与数字工程 2008(09)
    • [13].一种基于DCT变换域的数字图像水印技术的实现方法[J]. 信阳师范学院学报(自然科学版) 2008(04)
    • [14].基于DCT变换和鸡群优化算法的图像匹配[J]. 计算机与数字工程 2020(06)
    • [15].基于能量模的DCT域水印算法[J]. 黑龙江科技信息 2017(01)
    • [16].DCT域维纳滤波语音增强[J]. 计算机工程与应用 2015(08)
    • [17].基于DCT变换的图像压缩研究[J]. 科技风 2014(02)
    • [18].基于DCT快速变换的图像压缩编码算法[J]. 计算机技术与发展 2014(07)
    • [19].基于两级DCT和正交投影的单样本人脸识别[J]. 计算机应用与软件 2013(01)
    • [20].DCT变换在图像压缩中的应用[J]. 计算机与现代化 2013(04)
    • [21].有效降低方块效应的DCT系数量化方法[J]. 中国图象图形学报 2011(02)
    • [22].一种基于DCT变换的古籍图像可见水印算法[J]. 中国科技信息 2010(13)
    • [23].基于小波分析和DCT的人脸特征提取[J]. 自动化技术与应用 2009(04)
    • [24].一种基于DCT域的自适应块效应消除算法[J]. 信息与控制 2008(02)
    • [25].整数DCT变换中变换基的通用生成算法[J]. 中国图象图形学报 2008(06)
    • [26].基于DCT变换的数字水印技术的研究与仿真[J]. 大众科技 2019(11)
    • [27].基于DCT算法的并联有源滤波器在医院供电系统中应用研究[J]. 电力电容器与无功补偿 2017(02)
    • [28].基于DCT频带能量的压缩感知重构算法[J]. 华南理工大学学报(自然科学版) 2015(01)
    • [29].湿式DCT同步器控制研究[J]. 机械工程师 2015(08)
    • [30].DCT域维纳滤波语音增强[J]. 湖南涉外经济学院学报 2014(01)

    标签:;  ;  ;  ;  ;  

    基于采样模型的多维矢量矩阵DCT整数变换编解码器研究
    下载Doc文档

    猜你喜欢