基于无线通讯的语音识别算法研究及软件开发

基于无线通讯的语音识别算法研究及软件开发

论文摘要

语音识别是语音信号处理的重要内容之一,如何提高语音识别的正确率则是语音识别研究的主要目的。本文从提高语音特征对语音信号表征的精确度入手来提高语音识别的正确率和鲁棒性。而说话人识别是语音识别的一种特殊情况,具有非常广泛的应用前景,在本文中我们同时也对说话人识别算法开展了较深入的研究。此外,随着无线通讯的日益发展,基于无线通讯的语音识别越来越受到人们的重视。由于无线通讯过程中存在着信道的衰落,使得对经过无线信道的语音识别有了新的要求。因此,如何利用计算机模拟语音信号在真实信道中的传输,从而有利于寻找提高基于无线通讯的语音识别正确率的方法也是本文研究的内容之一。我们的主要工作如下: (1) 分析了信号在无线信道中传播的衰落原理,介绍了一种多径衰落模型,即发送信号时由于信号经由传播路径以不同的延迟到达接收机,从而引起的数字通讯系统中的符号间干扰。我们利用信道一般服从平稳随机过程的原理,从Gauss随机过程出发构造了一个多径衰落信道的模拟平台。而该平台的建立可以模拟语音信号在无线信道中传输的真实情境,从而有利于寻找具有较高识别正确率的方法; (2) 在讨论当前已有语音识别主流算法的基础上,提出了一种新的方法以提高语音识别的正确率。该方法首先利用MVDR 谱估计方法得到语音信号的较真实的特征,然后再利用ICA 算法对所得到的语音特征进行特征变换,以便更好地表征语音的特性,从而提高语音识别的正确率和鲁棒性。实验表明,这里所提供的算法具有很好的性能; (3) 对比了当前主流的说话人识别算法的优缺点,指出基于支撑向量机(SVM)的说话人识别效果好于基于高斯混合模型(GMM)的说话人识别,然而同时我们发现SVM 算法的效率较低。于是,这里我们提出了一种改进的算法思想,即优化支撑向量机(OSVM),来减少支撑向量机的个数,从而提高语音识别的效率。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题背景
  • 1.2 研究历史及现状
  • 1.3 课题的主要研究内容
  • 1.4 本文的组织结构
  • 第二章 语音信号的特征提取
  • 2.1 语音信号的产生
  • 2.1.1 语音信号产生的机理
  • 2.1.2 语音信号产生的数学模型
  • 2.2 语音信号的预处理
  • 2.2.1 增益控制、预滤波、模/数(A/D)转换
  • 2.2.2 预加重
  • 2.2.3 加窗
  • 2.2.4 端点检测
  • 2.3 语音信号的时域特征
  • 2.4 语音信号的频域特征
  • 2.4.1 基于线性预测的倒谱系数(LPCC)
  • 2.4.2 基于Mel 频率的倒谱系数(MFCC)
  • 2.5 MVDR 谱估计方法
  • 2.5.1 简介
  • 2.5.2 MVDR 谱的计算
  • 2.5.3 滤波器介绍
  • 2.6 基频提取
  • 2.7 小结
  • 第三章 语音识别
  • 3.1 ICA 方法
  • 3.1.1 ICA 的基本原理
  • 3.1.2 ICA 的主要算法
  • 3.2 时间归整
  • 第四章 说话人识别
  • 4.1 高斯混合模型
  • 4.2 SVM 方法
  • 4.2.1 简介
  • 4.2.2 支撑向量机的基本原理
  • 第五章 数字通信的信道衰落模拟
  • 5.1 信道衰落模拟方法
  • 5.2 结论
  • 第六章 语音信号处理的算法研究
  • 6.1 算法的提出(一)--语音识别方面
  • 6.1.1 算法思想
  • 6.1.2 算法流程
  • 6.1.3 计算机仿真
  • 6.1.4 算法实现
  • 6.1.5 小结
  • 6.2 算法的提出(二)――说话人识别方面
  • 6.2.1 算法思想
  • 6.2.2 计算机仿真
  • 6.2.3 小结
  • 第七章 语音信号处理的软件设计与实现
  • 7.1 需求
  • 7.2 总体设计思路、系统结构和程序组织
  • 7.3 软件实现的关键方法和技术
  • 7.4 小结
  • 第八章 总结与建议
  • 参考文献
  • 成果
  • 致谢
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  ;  

    基于无线通讯的语音识别算法研究及软件开发
    下载Doc文档

    猜你喜欢