语音转换中音段特征的建模与转换的研究

语音转换中音段特征的建模与转换的研究

论文摘要

语音转换就是将一个说话人(源说话人)语音中的个性特征信息进行转换,使之具有另一个说话人(目标说话人)的个性特征,从而使得转换后的语音听起来就像是目标说话人的声音的一种语音信号处理技术。该技术不仅具有重要的理论研究意义,而且具有良好的应用价值,它的研究及发展研究愈来愈受到国内外学者的关注。本文的主要工作和创新如下:(1)简要介绍了语音转换的一些应用价值和当前的主要经典算法,讨论了常用的语音个性特征参数,以及语音转换系统的基本原理。(2)研究了经典的基音频率转换方法,针对经典算法在不同程度上存在转换精度和合成语音质量不高的情况。本文提出基于STRAIGHT模型和BP神经网络的基音频率转换算法。客观测试和主观测试上都取得了较好的效果。(3)研究了基于神经网络的频谱包络转换方法,考虑到神经网络训练算法有很多,但大都有一定自身的缺陷,针对梯度下降法训练速度慢和易导致陷入局部最优的问题,引出了基于量子粒子群优化BP神经网络的算法,并将其算法应用到的语音谱包络转换中,由粒子群优化算法训练的BP神经网络捕获说话人的语音频谱包络映射关系,以实现不同说话人之间声音特性的转换,该方法在一定程度上提高了转换语音性能。本文在MATLAB平台上仿真,从主观和客观两个方面评价系统的性能。仿真结果表明,本文所采用的转换方法能够取得较好的效果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 语音转换技术的概念
  • 1.2 语音转换技术的研究意义和现状
  • 1.2.1 语音转换技术的研究意义
  • 1.2.2 语音转换技术的研究现状
  • 1.3 目前语音转换系统有待解决的问题
  • 1.4 论文的组织结构安排
  • 第二章 语音转换系统相关问题介绍
  • 2.1 语音信号基本原理
  • 2.1.1 语音的生成机理
  • 2.1.2 语音的数学模型
  • 2.2 语音信号的预处理
  • 2.3 语音特征参数
  • 2.4 语音转换的系统模型
  • 2.4.1 语音转换系统的构成
  • 2.4.2 语音的分析/合成模型
  • 2.4.3 参数对齐方法
  • 2.5 语音转换经典算法
  • 2.5.1 矢量码书映射算法
  • 2.5.2 说话人插值法
  • 2.5.3 线性多变量回归法
  • 2.5.4 动态频率规整法
  • 2.5.5 高斯混合模型法
  • 2.6 语音转换的性能评价方法
  • 2.6.1 客观评价方法
  • 2.6.2 主观评价方法
  • 2.7 本章小结
  • 第三章 基于人工神经网络的基音频率的转换
  • 3.1 神经网络的基本概念
  • 3.1.1 神经元的数学模型
  • 3.1.2 网络的连接模式
  • 3.1.3 学习规则
  • 3.2 神经网络的基本模型结构
  • 3.2.1 BP 神经网络
  • 3.2.2 RBF 神经网络
  • 3.3 基于BP 神经网络的基音频率转换
  • 3.3.1 经典的基音频率建模和转换算法
  • 3.3.2 基于SRRIAGHT+BP 神经网络的基音频率转换算法
  • 3.4 实验与仿真
  • 3.4.1 实验条件与环境
  • 3.4.2 实验结果
  • 3.5 本章小结
  • 第四章 基于量子粒子群优化神经网络的声道谱参数转换
  • 4.1 引言
  • 4.2 粒子群优化算法与神经网络
  • 4.2.1 基本PSO 算法描述
  • 4.2.2 量子粒子群算法
  • 4.2.3 QPSO 优化神经网络
  • 4.2.4 量子粒子群算法与梯度下降法的性能比较
  • 4.3 基于QPSO 优化神经网络的声道谱参数转换算法
  • 4.3.1 基于人工神经网络模型的声道谱参数转换算法
  • 4.3.2 基于QPSO 优化BP 神经网络的声道谱特征参数转换
  • 4.4 实验与仿真
  • 4.4.1 实验条件与环境
  • 4.4.2 实验结果
  • 4.5 本章小结
  • 第五章 总结与展望
  • 5.1 本文工作总结
  • 5.2 今后研究展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].基于翻转梅尔频率倒谱系数的语音变调检测方法[J]. 计算机应用 2019(12)
    • [2].语音助手能力评估研究及趋势分析[J]. 广东通信技术 2019(12)
    • [3].语音伪造与鉴伪的发展与挑战[J]. 信息安全学报 2020(02)
    • [4].广告语中语音隐喻的使用规则研究[J]. 传播力研究 2020(03)
    • [5].阻止语音欺诈的7种方法[J]. 计算机与网络 2020(09)
    • [6].5G初期语音业务方案与优化策略[J]. 广西通信技术 2019(03)
    • [7].在线语音直播发展动因探析[J]. 视听 2020(09)
    • [8].语音欺骗检测方法的研究现状及展望[J]. 数据采集与处理 2020(05)
    • [9].5G语音回落4G解决方案探讨[J]. 移动通信 2019(04)
    • [10].手机智能语音助手的发展与未来[J]. 通讯世界 2019(04)
    • [11].语音营销,是新机遇,还是新泡沫?[J]. 营销界 2019(02)
    • [12].语音在少数民族口传音乐中的作用——以赫哲族为例[J]. 北极光 2019(06)
    • [13].古交语音与中古语音的比较[J]. 汉字文化 2019(13)
    • [14].手机语音助手用户体验现状及发展[J]. 内蒙古煤炭经济 2019(15)
    • [15].语音助手市场增长惊人[J]. 董事会 2019(10)
    • [16].在线语音直播的兴起与发展探析[J]. 新闻研究导刊 2018(07)
    • [17].基于噪声分类和字典选择的语音活动检测[J]. 华中科技大学学报(自然科学版) 2016(12)
    • [18].语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J]. 物流技术 2017(01)
    • [19].一种基于语音活动检测的声源定位方法[J]. 电脑知识与技术 2017(04)
    • [20].互联网时代语音业务发展的思考分析[J]. 中国新通信 2017(08)
    • [21].一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J]. 华东理工大学学报(自然科学版) 2017(04)
    • [22].语音中继主叫号码的限制[J]. 通讯世界 2017(18)
    • [23].在线语音直播开启直播新战场[J]. 新闻战线 2017(21)
    • [24].基于同轴的广电语音业务的实现[J]. 中国有线电视 2016(08)
    • [25].瑜伽语音冥想对大学生心理健康的积极影响[J]. 赤子(上中旬) 2014(15)
    • [26].语音感知和语音产出——二语语音习得研究梳辨[J]. 语文学刊(外语教育教学) 2015(04)
    • [27].国内外语语音能力研究论析[J]. 宿州学院学报 2015(06)
    • [28].关于语音转换实现的研究[J]. 价值工程 2015(29)
    • [29].浅析语音导览系统在博物馆中的应用[J]. 学理论 2015(32)
    • [30].语音反馈的实践改进[J]. 教学月刊小学版(综合) 2020(06)

    标签:;  ;  ;  ;  ;  

    语音转换中音段特征的建模与转换的研究
    下载Doc文档

    猜你喜欢