听觉—声学混合LPC方法研究

听觉—声学混合LPC方法研究

论文摘要

语音编码中,感觉加权滤波器、综合滤波器、对数增益滤波器都涉及到线性预测分析技术,这种技术在语音处理中发挥着核心作用。本文的主要工作是提出一种结合声学特性与听觉特性的混合LPC(Auditory-Acoustic- Hybrid -LPC)系数,使得编码后的合成语音听觉质量有了改善,提高了PESQ值。实验结果表明H-LPC可以改善编码算法的合成语音质量,对编码算法的研究有积极意义。本文首先对H-LPC的求解算法进行了研究,基于对美尔倒谱系数(MFCC)与LPC美尔倒谱系数(LPCMCC)的原理分析和算法实现,将MFCC与LPCMCC的听觉特性结合,用MFCC的峰谷值特性去调节LPCMCC,以增强其听觉特性,使之能够真实准确地反映声音的听觉特性,进而将这种听觉性质反馈到LPC系数上。为检测H-LPC加入听觉特性的程度以及声学特性的损耗,实验中对LPC系数进行功率谱密度(PSD)估计检测。原始语音的PSD采用直接法求解,LPC系数的PSD选用AR模型功率谱估计中的Yule-Walker法估计。实验结果表明,H-LPC的PSD相较于传统LPC有一定程度的减弱,但是已经基本达到目前LPC的使用要求,对于原始语音PSD的体现率达到了95%以上。在H-LPC应用在编码算法之前,将其求解算法中的各个参数与编码算法中综合滤波器的参数进行了同一化工作。关键技术是混合窗的加入,通过对MFCC求解算法以及LPCMCC求解流程的对比研究,证明MFCC可以直接使用混合窗代替哈明窗而对运算过程不产生叠加递归影响,LPCMCC的求解中涉及到自相关函数的递归叠加运算,将这部分运算过程修正。同一化工作结束后,求出H-LPC加入8Kbit/s LD-aCELP编码算法。对加入H-LPC的8Kbit/s LD-aCELP语音编码算法得到的合成语音进行收听与PESQ检测。实验结果表明使用综合听觉特性与声学特性的H-LPC系数编解码得到的合成语音质量与G.728编码算法得到的合成语音质量相当,比LD-aCELP算法的合成语音质量高,加入H-LPC的LD-aCELP算法的PESQ值为3.630。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 概述
  • 1.1.1 G.728 编码算法的提出及其研究现状
  • 1.1.2 衡量语音编码性能的主要指标
  • 1.1.3 本课题的研究意义
  • 1.2 基于听觉系统的梅尔倒谱系数(MFCC)
  • 1.2.1 听觉掩蔽效应
  • 1.2.2 MEL 标度
  • 1.2.3 MFCC 系数提取算法
  • 1.3 基于LPC 系数的LPC 美尔倒谱系数(LPCMCC)
  • 1.3.1 线性预测分析
  • 1.3.2 LPCC 倒谱系数
  • 1.3.3 LPC 美尔倒谱系数(LPCMCC)
  • 1.4 LPCMCC 与MFCC 的异同
  • 1.5 论文完成工作及安排
  • 第二章 结合听觉特性与声学特性的混合LPC 系数求解
  • 2.1 MFCC 参数提取
  • 2.1.1 参数设置
  • 2.1.2 算法流程
  • 2.1.3 输出结果
  • 2.2 LPCMCC 的算法实现
  • 2.2.1 参数设置
  • 2.2.2 算法流程
  • 2.2.3 输出结果
  • 2.3 用MFCC 调整LPCMCC
  • 2.3.1 峰谷值的两两分组
  • 2.3.2 峰谷值处理
  • 2.3.3 H-LPCMCC 的生成
  • 2.3.4 H-LPCMCC 的输出结果图
  • 2.4 H-LPC 的求解
  • 2.4.1 LPCC 系数的求解
  • 2.4.2 H-LPC 系数的求解
  • 2.5 小结
  • 第三章 基于H-LPC 系数的功率谱估计
  • 3.1 功率谱估计(PSD)
  • 3.1.1 经典功率谱估计方法
  • 3.1.2 AR 模型功率谱估计
  • 3.1.3 Yule-Walker 法估计
  • 3.2 功率谱估计的C 语言算法实现
  • 3.2.1 频率分段
  • 3.2.2 模型增益因子
  • 3.2.3 算法流程
  • 3.3 基于LPC 系数的PSD 输出结果
  • 3.4 小结
  • 第四章 H-LPC 对LD-aCELP 语音编码算法的改进
  • 4.1 G.728 原理概述
  • 4.1.1 感觉加权滤波器
  • 4.1.2 综合滤波器
  • 4.1.3 LPC 系数的计算
  • 4.1.4 混合窗的设计
  • 4.2 H-LPC 在G.728 编码算法中的应用
  • 4.2.1 混合窗在H-LPC 求解算法中的应用
  • 4.2.2 综合滤波器算法中混合窗长的改变
  • 4.2.3 综合滤波器算法中H-LPC 的接入
  • 4.2.4 输入语音和合成语音的波形
  • 4.3 PESQ 值的测验
  • 4.4 基于PESQ 原理对H-LPC 求解算法的改进探索方案
  • 4.5 小结
  • 第五章 结论与展望
  • 5.1 本文所完成的工作
  • 5.2 对未来的展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].基于音高映射合成语音的汉语双字调声调训练[J]. 清华大学学报(自然科学版) 2017(02)
    • [2].机械合成语音,能最终实现吗?[J]. 世界科学 2012(02)
    • [3].基于TMS320C6678的合成语音检测系统的设计与实现[J]. 电子设计工程 2016(19)
    • [4].一种基于LSTM的合成语音自然度评价方法的研究[J]. 信息技术 2019(05)
    • [5].动脑不动口 脑机来帮忙[J]. 北方人(悦读) 2019(11)
    • [6].后置滤波器参数自适应的语音合成改进算法[J]. 计算机工程与应用 2017(01)
    • [7].声音复刻站:Lyrebird[J]. 少年电脑世界 2018(10)
    • [8].基于统计建模的可训练单元挑选语音合成方法[J]. 科学通报 2009(08)
    • [9].AI合成语音背景下播音主持应以情感制胜[J]. 传媒论坛 2018(23)
    • [10].低码率语音编码中过渡帧对合成语音的影响[J]. 应用声学 2016(01)
    • [11].融合自动检错的单元挑选语音合成方法[J]. 数据采集与处理 2016(02)
    • [12].基于合成质量预测的单元挑选语音合成优化方法[J]. 清华大学学报(自然科学版) 2013(06)
    • [13].TETRA与G.729语音编码算法的比较研究[J]. 电视技术 2013(15)
    • [14].可训练语音合成在越南语合成中的应用[J]. 计算机工程与应用 2012(35)
    • [15].汉语连续变调语音合成算法[J]. 计算机工程与应用 2009(15)
    • [16].改进的混合激励线性预测编码算法[J]. 新型工业化 2015(09)
    • [17].可训练语音合成在侗语合成中的应用[J]. 教育文化论坛 2012(06)
    • [18].改进的MELP低速率语音编码器[J]. 计算机工程与应用 2011(29)
    • [19].“声音”作为未来传播主流介质的洞察范式——以用户对语音新闻感知效果与测量为例[J]. 社会科学战线 2019(07)
    • [20].基于规则的汉语情感语音系统的设计与实现[J]. 电子测量技术 2009(11)
    • [21].MELP低速率语音编码器在DSP上的改进与优化[J]. 计算机应用研究 2011(06)
    • [22].自适应谱增强在MBE语音编码中的应用研究[J]. 重庆工商大学学报(自然科学版) 2013(03)
    • [23].基于短信和语音合成的报警接口设计[J]. 微计算机信息 2010(11)
    • [24].一种改进的MELP算法[J]. 应用科技 2008(05)
    • [25].多带激励MBE谱幅度估计与参数编解码方案研究[J]. 电子设计工程 2011(16)
    • [26].面向汉语统计参数语音合成的标注生成方法[J]. 计算机工程与应用 2016(19)
    • [27].汉语重音的凸显度分析与合成[J]. 声学学报 2015(01)
    • [28].藏语拉萨话语音合成语料库的研究与建立[J]. 科技信息 2013(09)
    • [29].声纹识别中合成语音的鲁棒性[J]. 模式识别与人工智能 2011(06)
    • [30].基于HMM的混合激励英语文语转换系统[J]. 江南大学学报(自然科学版) 2010(06)

    标签:;  ;  ;  

    听觉—声学混合LPC方法研究
    下载Doc文档

    猜你喜欢