
论文摘要
关于音频感知编码模型的研究主要集中在两个方面:一是各种音频压缩编码算法的研究;二是音频编解码器实现技术的研究。当前,随着移动通讯网络的普及,音频产品的传播变得更加频繁和方便,但移动设备终端的计算能力和存储容量都是有限的,因此,低复杂度高质量的音频编码算法研究和系统实现成为数字音频处理领域的研究热点之一。为实现一个低复杂度高质量的音频编解码器,本论文的工作主要围绕下述两个方面展开:在算法级上,选择音频感知编码模型中具有突出优点的AAC编码系统为研究对象,分别在频域变换、心理声学分析和量化编码这三大关键模块中进行算法优化,在保证编码质量的前提下,降低运算复杂度,减小编码耗时;在实现技术方面,采用SOPC设计策略,使用“微处理器软核+专用IP核”的模式进行软硬件协同工作,在FPGA开发平台上实现一个低复杂度高音质的AAC编解码系统。本文的主要工作和创新如下:(1)滤波器组是音频感知编码模型中的计算密集型模块,占用较大的运算量。本文针对滤波器组的快速实现算法进行了研究,分别提出了两种改进方案——基于递归结构和基于N/8点FFT核的MDCT/IMDCT快速实现方案,适于IP核设计并可以实现MDCT/IMDCT电路共用。第一种方案具有电路规整、占用硬件资源少、运算速度快和吞吐能力强等优点,与现有递归算法相比,只需要N2/16个周期就可以完成N点MDCT/IMDCT变换。第二种方案,相对于目前流行的基于N/4点FFT核的实现方法,增加了一些加法器,但降低了对乘法器数目的需求,减小了计算误差,同时将运算速度提升了近一倍。(2)为消除预回声的影响,音频感知编码模型在心理声学模块中通过暂态分析,判断信号的瞬变性,以指导变换编码中自适应长短块的切换。本文结合入耳听觉特性和音频编码特点,草拟了一种听觉感知阈值的拟合模型框架,并且,分析了基于感知熵的块类型选择算法存在的缺点,提出了一种简单的暂态分析方法——时域峰值检测法,能在时域上快速判断出音频信号的瞬变性,从而,对平稳信号和瞬变信号使用不同的变换窗长度,以获取较好的时域分辨率和频域分辨率。在对音质影响不大的前提下,提高了心理声学模型的计算速度。(3)音频感知编码模型中使用Brandenburg的双循环量化处理结构,可以获取较好的编码质量,但存在收敛速度慢、迭代次数多的缺点,不具备实时处理能力。本文在原量化模块设计思想的指导下,提出了基于噪声预测的量化-编码结构。通过确定公共缩放因子和尺度因子的制约关系,缩小量化阶的迭代范围,加快了收敛速度,简化了量化模块的运算复杂度。与原有双循环迭代结构相比,在对音质影响不大的前提下,运算速度提高了一倍。相应地,在反量化模块中,提出了一种改进型的查表方法,与现有算法相比,减少了50%的存储空间,并将计算误差控制在10-6级别内。(4)依据嵌入式系统实时操作和可编程化的要求,本文提出了一种基于SOPC架构的数字音频编解码系统的可编程实验模型。选择MPEG AAC为实验对象,通过对编解码系统中关键模块的算法改进和部分电路的硬件优化,软硬件协同设计,降低编解码的运算复杂度。在保证编码质量的前提下,系统的编码速度提高了一倍,并且实现了实时解码。经过主/客观评测系统评估,取到了较好的编码质量评测分数。
论文目录
摘要ABSTRACT第1章 绪论1.1 研究背景及意义1.2 数字音频编码技术的发展及现状1.2.1 子带/变换编码方法1.2.2 数字音频压缩的标准化1.2.3 几种常用的音频编码标准1.2.4 音频编解码器实现技术的现状1.3 论文的研究思路1.4 论文的主要内容及结构安排1.4.1 主要内容1.4.2 论文结构1.5 本章小结第2章 音频感知编码的理论基础和关键技术2.1 编码的基础理论2.1.1 信息测度2.1.2 平均码长2.1.3 编码效率2.1.4 冗余度2.2 相关冗余的消除2.2.1 频域变换2.2.2 预测技术2.2.3 M/S立体声2.3 编码冗余的消除2.3.1 等长编码2.3.2 Huffman编码2.3.3 算术编码2.4 心理声学冗余的消除2.4.1 听觉特性2.4.2 临界频带2.4.3 掩蔽效应2.4.4 心理声学模型2.5 其他编码技术2.5.1 量化处理2.5.2 时域噪声整形2.5.3 强度立体声2.6 音频保真度和质量2.6.1 主观保真度准则2.6.2 客观保真度准则2.7 本章小结第3章 音频编码的感知模型3.1 心理声学参数的计算3.1.1 感知熵PE3.1.2 块类型选择3.1.3 信掩比和掩蔽阈值3.1.4 比特数计算3.1.5 存在的不足3.2 感知听觉模型的进一步推想3.2.1 CMDCT频域分析3.2.2 Mel倒谱分析3.2.3 听觉阈值的拟合3.3 暂态分析方法的改进3.3.1 基于感知熵的块类型选择3.3.2 新的时域峰值检测方法3.3.3 实验分析3.4 本章小结第4章 滤波器组实现技术的优化研究4.1 滤波器组4.1.1 加窗技术4.1.2 MDCT定义公式4.1.3 重构和叠加4.2 基于递归结构的MDCT/IMDCT快速算法4.2.1 优化模型及设计方法4.2.2 算法比较和分析4.2.3 FPGA验证4.3 基于N/8点FFT核的MDCT快速实现4.3.1 优化模型及设计方法4.3.2 算法比较和分析4.3.3 FPGA验证4.4 本章小结第5章 量化模块的优化方法研究5.1 基于噪声能量的量化模块简化5.1.1 双循环结构的量化模块5.1.2 双循环迭代的简化5.1.3 实验分析5.2 反量化模块的软件优化5.2.1 定义公式5.2.2 优化方法5.2.3 实验分析5.3 本章小结第6章 低复杂度高保真音频编解码系统的SOPC建模6.1 SOPC系统的软硬件协同设计6.2 AAC编码算法及SOPC建模6.2.1 算法流程分析6.2.2 模块复杂度分析及软硬件划分6.3 AAC解码算法及SOPC建模6.3.1 算法流程分析6.3.2 模块复杂度分析及软硬件划分6.4 SOPC系统中MDCT/IMDCT硬件模块的设计6.4.1 功能说明6.4.2 接口设计6.4.3 子模块设计6.4.4 实验结果6.5 SOPC系统中Huffman解码模块的硬件设计6.5.1 功能说明6.5.2 接口设计6.5.3 子模块设计6.5.4 实验结果6.6 SOPC系统的软件优化6.7 软硬件协同设计的验证6.7.1 计算复杂度对比6.7.2 音频质量评测6.8 本章小结第7章 结束语7.1 论文总结7.2 进一步的工作参考文献致谢在读期间发表的学术论文与取得的其他研究成果
相关论文文献
标签:音频感知编码论文; 心理声学分析论文; 量化论文;