说话人识别技术研究与改进

说话人识别技术研究与改进

论文摘要

说话人识别技术是当今的一个研究热点,在保安、公安司法、军事、财经和信息服务等领域有广泛的应用前景。在纯净的语音下,识别的效果比较好,但是在有噪声的情况下,识别率比较低。针对这种情况,笔者展开了一系列的研究,主要的工作如下:1.分析了当前说话人识别的发展现状、技术难点及需要改进的方向,并研究了与之相关的语音信号处理的内容。2.讨论了两种说话人识别算法:矢量量化(VQ)和高斯混合模型(GMM),针对两种方法建立了与文本无关的说话人识别系统,并用MATLAB仿真实现。3.针对目前说话人识别特征提取的不足,研究了用主分量分析(PCA)、基于Fisher准则线性判别分析(FLDA)、PCA+FLDA方法对MFCC提取后的特征进行变换的方法。另外还研究了用小波变换方法对说话人特征进行改进,研究表明改进的方法能够取得较好的效果。4.研究了麦克风阵语音增强技术。详细分析了延迟求和波束形成、自适应波束形成和基于子空间的阵列语音增强方法,并且研究了用小波变换的方法进行语音增强,并将小波变换方法后置于自适应波束形成方法,最后对各种方法进行了仿真实验。5.将麦克风阵语音增强和PCA+FLDA的特征提取方法用于低信噪比下的说话人识别中,大大提高了噪声环境下的说话人识别率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 说话人识别概述
  • 1.1.1 说话人识别的概念和原理
  • 1.1.2 说话人识别的分类
  • 1.1.3 说话人识别发展现状及技术难点
  • 1.2 语音增强概述
  • 1.3 基于语音增强和改进特征的与文本无关说话人识别的合理性分析与探讨
  • 1.4 论文的内容安排
  • 第二章 语音信号数字处理基础
  • 2.1 语音信号的预处理
  • 2.1.1 预加重
  • 2.1.2 分帧与加窗
  • 2.2 语音信号的时域分析
  • 2.2.1 短时能量及短时平均幅度分析
  • 2.2.2 短时平均过零率分析
  • 2.3 语音信号的频域分析
  • 2.3.1 滤波器组方法
  • 2.3.2 利用短时傅立叶变换求语音的短时谱
  • 2.4 语音信号的时频域分析
  • 2.5 端点检测
  • 2.6 本章小结
  • 第三章 说话人识别算法的实现
  • 3.1 说话人识别特征参数的提取
  • 3.1.1 线性预测倒谱系数(LPCC)特征提取
  • 3.1.2 MEL频率倒谱参数(MFCC)特征提取
  • 3.1.3 倒谱参数加权和差分倒谱参数
  • 3.2 基于VQ的说话人识别
  • 3.2.1 矢量量化的概念
  • 3.2.2 矢量量化的失真测度
  • 3.2.3 最佳码本的设计
  • 3.2.4 应用VQ进行说话人识别的原理
  • 3.3 基于GMM的说话人识别
  • 3.3.1 GMM的基本概念
  • 3.3.2 GMM模型的参数估计
  • 3.3.3 GMM模型的识别问题
  • 3.4 系统实现及实验仿真
  • 3.5 本章小结
  • 第四章 说话人识别算法的改进
  • 4.1 基于主分量分析(PCA)的说话人特征变换
  • 4.1.1 主分量分析简介
  • 4.1.2 特征维数选取的原则
  • 4.1.3 利用PCA进行特征变换
  • 4.1.4 实验结果与分析
  • 4.2 基于Fisher准则线性判别分析(FLDA)的说话人特征变换
  • 4.2.1 线性判别分析简介
  • 4.2.2 利用FLDA进行特征变换
  • 4.2.3 实验结果与分析
  • 4.3 基于PCA与FLDA结合的说话人特征变换
  • 4.3.1 PCA与FLDA结合改进说话人特征的过程
  • 4.3.2 实验结果与分析
  • 4.4 基于小波变换的抗噪说话人特征
  • 4.4.1 小波分析的基本理论
  • 4.4.2 小波的多尺度分析
  • 4.4.3 MFCC与小波结合进行参数提取
  • 4.4.4 离散小波变换(DWT)代替离散傅立叶变换(DCT)
  • 4.4.5 基于小波包方法的特征提取
  • 4.5 本章小结
  • 第五章 麦克风阵语音增强研究与改进
  • 5.1 延迟-求和波束形成
  • 5.2 自适应宽带波束形成方法
  • 5.2.1 宽带波束形成系统
  • 5.2.2 自适应宽带波束形成系统
  • 5.3 小波分析方法用于语音增强
  • 5.3.1 小波去噪的基本原理
  • 5.3.2 小波参数的选取
  • 5.3.3 小波与自适应波束形成结合的语音增强方法
  • 5.4 基于子空间方法的麦克风阵语音增强
  • 5.4.1 子空间方法的原理
  • 5.4.2 时域约束估计方法
  • 5.4.3 多通道子空间的语音增强方法
  • 5.5 本章小结
  • 第六章 结合麦克风阵列语音增强和改进特征的说话人识别
  • 6.1 基于语音增强和改进特征的说话人识别的分析
  • 6.2 语音和噪声库的建立
  • 6.3 预处理
  • 6.4 实验结果及分析
  • 6.5 本章小结
  • 第七章 总结与展望
  • 7.1 论文工作总结
  • 7.2 下一步的研究工作
  • 参考文献
  • 作者在攻读硕士期间的主要研究成果
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  ;  

    说话人识别技术研究与改进
    下载Doc文档

    猜你喜欢