基于压缩感知的语音重构及其在说话人识别系统中的应用

基于压缩感知的语音重构及其在说话人识别系统中的应用

论文摘要

在传统的信息的采集过程中,依据奈奎斯特采样定律的要求,信号的采样速率必须至少为信号带宽的两倍,随着信息量的增加导致信号的带宽越来越大,同时造成采样速率不断变大,使得计算量变得很大,以至于在硬件设备中的采样实现也成了难题,阻碍了信息技术的发展。06年,Donoho, Candes等人提出了一种新颖的理论——压缩感知理论(Compressed Sensing, Compressive Sampling, CS)。与奈奎斯特定律不同的是,该理论认为只要满足一定的条件,通过极少数的测量值就可以高概率地恢复原信号,实现了信号的低速采样。对于说话人识别系统来说,随着说话人个数的增加其数据量随之增加。本文将压缩感知理论应用到说话人识别系统中对于语音信号的处理中,在对系统识别性能影响不大的基础上,实现了语音信号的低速率采样,有效地减少了说话人识别系统中数据的存储量。本文的主要工作如下:1、研究说话人识别的基本原理、说话人识别模型的分类以及特征参数的选择与提取。2、研究压缩感知基本理论以及基于压缩感知理论的信号重建方法。3、研究关于语音信号的压缩感知重构,针对语音信号在离散余弦域上的近似稀疏性,选择随机高斯矩阵作为观测矩阵,分别采用正交匹配追踪算法和单纯形法对语音信号进行重构,分析观测比的变化对重构语音信号质量即重构信噪比的影响。为了改善观测矩阵的性能,在对随机高斯观测矩阵进行近似QR分解的基础上,对其分解得到的上三角矩阵进行行向量正交处理,通过理论分析和实验结果得出:测量矩阵改进后的重建效果优于测量矩阵改进前的重建效果。4、在基于矢量量化的说话人系统中,研究不同观测比下语音信号进行压缩感知重构后对系统识别性能的影响。实验表明,当观测比为适当值时,说话人识别系统中的语音数据得到了较大程度的压缩,同时对系统的识别性能影响不大。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 课题的背景和意义
  • 1.2 国内外研究现状
  • 1.2.1 说话人识别研究现状
  • 1.2.2 压缩感知理论的研究与应用
  • 1.3 本文组织结构
  • 第2章 说话人识别特征参数的提取
  • 2.1 说话人识别的基本介绍
  • 2.1.1 说话人识别的基本概念
  • 2.1.2 说话人识别系统基本结构
  • 2.1.3 说话人识别方法的分类
  • 2.2 特征参数的提取
  • 2.2.1 语音的产生模型及同态信号处理的基本原理
  • 2.2.2 倒谱的定义及性质
  • 2.2.3 Mel频率倒谱参数
  • 2.3 本章小结
  • 第3章 压缩感知理论
  • 3.1 压缩感知理论介绍
  • 3.1.1 信号的稀疏性与可压缩性
  • 3.1.2 随机观测矩阵
  • 3.2 压缩感知信号重建
  • 3.3 本章小结
  • 第4章 基于压缩感知的语音信号重构
  • 4.1 语音信号的稀疏性
  • 4.2 观测矩阵的选择
  • 4.2.1 随机高斯观测矩阵
  • 4.2.2 随机高斯观测矩阵的近似QR分解及其改进
  • 4.3 重构算法
  • 4.3.1 OMP算法
  • 4.3.2 Simplex算法
  • 4.4 语音信号重构实验
  • 4.4.1 观测比的变化对重构语音信号质量的影响
  • 4.4.2 观测矩阵对重构语音信号质量的影响
  • 4.5 本章小结
  • 第5章 基于压缩感知语音重构的矢量量化说话人识别
  • 5.1 矢量量化的基本原理
  • 5.1.1 矢量量化的失真测度
  • 5.1.2 码书的形成
  • 5.2 基于VQ的说话人识别
  • 5.3 不同观测比下的说话人辨别实验
  • 5.4 本章小结
  • 总结与展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  ;  

    基于压缩感知的语音重构及其在说话人识别系统中的应用
    下载Doc文档

    猜你喜欢