Print

基于MELP模型的汉语耳语音转换为正常音的实现

论文摘要

耳语音作为一种特殊的语音交流方式,近些年来逐渐受到从事语音研究和医学研究的专家学者们的重视。耳语音转换为正常音,可应用在公共场合下手机的通讯、嗓音病人正常语音交流的辅助及公安司法的某些工作的特殊需要等方面。因此耳语音转换为正常音的研究具有重要的理论价值和应用价值。本文主要研究耳语音转换为正常音的实现,设计了一个基于混合激励线性预测(MELP)模型的耳语音转换系统。根据MELP声码器的原理,对正常语音进行所需各个参数的提取并合成出语音,初步建立了一个MELP合成系统。然后,根据MELP合成系统的结构及汉语耳语音与正常音的不同特点,对耳语音的参数进行分析,通过与正常音参数的比较、修正得到耳语音转换所需的参数。本文提出了基于次序统计滤波进行端点检测的方法,提取了耳语音的说话人性别信息,并根据实验统计得到耳语音和正常语音增益的转换模型。简要介绍了汉语耳语音的声韵分割、声调识别、共振峰匹配以及根据性别信息和声调信息进行基频估计等问题。最后将匹配好的各项参数,输入到合成系统中,完成耳语音向正常音的转换,并对合成语音进行主观测试,结果表明了本文所提方法具有可行性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题研究的背景和意义
  • 1.2 课题研究的概况
  • 1.3 本文的主要工作及论文的内容安排
  • 1.3.1 本文的主要工作
  • 1.3.2 论文的内容安排
  • 第二章 耳语音的特点
  • 2.1 耳语音的发音机理
  • 2.2 耳语音的声学特性
  • 2.3 耳语音的听觉感知
  • 2.3.1 音高感知
  • 2.3.2 元音的辨听
  • 2.3.3 辅音的辨听
  • 2.3.4 说话人性别的辨听
  • 第三章 MELP 模型
  • 3.1 MELP 声码器的基本原理
  • 3.1.1 MELP 声码器模型
  • 3.1.2 MELP 声码器算法概述
  • 3.2 MELP 的参数提取
  • 3.2.1 基音提取
  • 3.2.2 带通清浊音判决
  • 3.2.3 抖动浊音检测
  • 3.2.4 线性预测分析
  • 3.2.5 增益估计
  • 3.2.6 傅氏级数幅值的计算
  • 3.3 MELP 的合成
  • 3.3.1 噪声抑制
  • 3.3.2 参数插值
  • 3.3.3 混合激励的产生
  • 3.3.4 自适应谱增强
  • 3.3.5 线性预测合成
  • 3.3.6 增益调整
  • 3.3.7 脉冲整形滤波
  • 3.4 正常语音的MELP 合成结果
  • 第四章 适合于耳语音的语声合成模型的建立
  • 4.1 引言
  • 4.2 耳语音预处理
  • 4.2.1 端点检测
  • 4.2.2 声韵分割
  • 4.3 耳语音转换合成中关键参数的实现
  • 4.3.1 共振峰的匹配
  • 4.3.2 声调识别
  • 4.3.3 性别信息的提取
  • 4.3.4 增益的匹配
  • 4.3.5 基频的估计
  • 4.4 其他参数的设定
  • 4.5 语音的合成
  • 第五章 合成的结果及评价
  • 5.1 耳语音转换的合成结果
  • 5.2 结果分析
  • 5.3 结果评价
  • 第六章 总结与展望
  • 6.1 本文总结
  • 6.2 进一步工作
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 详细摘要
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/d18b1af730eb7b4025864d61.html