噪声环境下说话人识别研究

噪声环境下说话人识别研究

论文摘要

随着社会信息化程度的发展,越来越多的场合需要对人的身份进行可靠地识别,传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为认证手段的技术逐渐发展起来。说话人识别属于生物认证技术的一种,是一项根据语音波形中反映的说话人生理和行为特征的语音参数自动鉴别说话人身份的技术。随着计算机技术发展,说话人识别技术越来越受到人们的重视。在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数。其二,设计出行之有效的分类器。说话人识别虽然研究历史较长,但仍有许多问题有待研究解决,噪声环境下的说话人识别即是其一。在纯净语音环境下的说话人识别系统已经有很高的识别率,但是在噪声环境中识别率显著降低。为了提高说话人识别系统的在噪声环境中的识别率,本文考虑到小波变换的优点,结合具有较好鲁棒性的特征参数GDS(group delay spectrum),提取基于小波变换的GDS特征参数。对于分类器的设计,主要应用矢量量化的技术。通过不同噪声在不同信噪比下的实验来验证提取参数的有效性。本文首先介绍了说话人识别技术的研究背景和应用领域,概要介绍了说话人识别技术。接着对说话人识别技术中常用的特征参数进行了性能研究,通过实验比较了它们的鲁棒性。针对噪声环境下,提出了新的组合特征参数,并详细介绍了特征参数的提取过程。然后给出了分类器的设计方法。最后,根据提出的方法实现了说话人识别系统。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文研究背景
  • 1.2 说话人识别的应用领域
  • 1.3 说话人识别技术
  • 1.3.1 说话人识别的基本概念
  • 1.3.2 说话人识别系统结构
  • 1.3.3 说话人识别的关键技术
  • 1.3.4 说话人识别系统性能
  • 1.4 噪声环境中的说话人识别技术
  • 1.4.1 噪声的分类及影响
  • 1.4.2 抗噪声处理的基本方法
  • 1.5 本课题的主要研究内容
  • 第2章 特征参数提取
  • 2.1 语音信号处理基础
  • 2.1.1 语音信号特征
  • 2.1.2 时域分析
  • 2.1.3 频域分析
  • 2.1.4 语谱分析
  • 2.1.5 倒谱分析
  • 2.2 线性预测系数(LPC)和倒谱系数(LPCC)
  • 2.2.1 线性预测系数(LPC)
  • 2.2.2 倒谱系数(LPCC)
  • 2.3 MFCC和差分MFCC参数的提取
  • 2.3.1 MFCC参数的提取
  • 2.3.2 差分MFCC参数的提取
  • 2.4 GDS参数的提取
  • 2.5 实验
  • 2.6 本章小结
  • 第3章 基于小波变换GDS参数提取
  • 3.1 小波分析理论简介
  • 3.1.1 小波和小波变换
  • 3.1.2 多分辨率分析与Mallat算法
  • 3.2 小波变换GDS参数提取
  • 3.3 实验
  • 3.4 本章小结
  • 第4章 分类器设计
  • 4.1 分类器设计方法简介
  • 4.1.1 基于模板匹配模型的方法
  • 4.1.2 基于概率模型的方法
  • 4.1.3 基于判决模型的方法
  • 4.1.4 基于混合模型的方法
  • 4.2 矢量量化的基本原理
  • 4.3 VQ的识别模型
  • 4.3.1 基于LBG算法的码本形成过程
  • 4.3.2 基于VQ的说话人识别
  • 4.4 本章小结
  • 第5章 说话人识别系统的实现
  • 5.1 语音信号的预处理
  • 5.1.1 预滤波和模数变换
  • 5.1.2 预加重
  • 5.1.3 分帧和加窗
  • 5.1.4 端点检测
  • 5.2 说话人识别系统实现与研究
  • 5.2.1 说话人识别系统的实现
  • 5.2.2 实验数据的分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].基于说话人的音频分割与聚类[J]. 心智与计算 2010(02)
    • [2].基于变分贝叶斯改进的说话人聚类算法[J]. 数据采集与处理 2017(01)
    • [3].基于说话人辨识的自上而下听觉显著性注意模型[J]. 计算机系统应用 2017(07)
    • [4].说话人用意的认知加工机制:基于误解分析的证据[J]. 外语教学 2016(04)
    • [5].“权威度”视角下终助词「ね」的附加考察[J]. 散文百家(理论) 2020(09)
    • [6].润泽有效的课堂,从引导学生学会倾听开始[J]. 快乐阅读 2016(24)
    • [7].那些有故事的“说话人”[J]. 长江丛刊 2017(01)
    • [8].汉日位移动词比较研究[J]. 唐山文学 2017(02)
    • [9].简约而不简单的英语实用口语[J]. 初中生辅导 2016(36)
    • [10].临时性词汇及其语用功能探析[J]. 青年文学家 2017(09)
    • [11].说话人意义的形成机制及其功能——“语言与人”系列研究(1)[J]. 外语学刊 2013(06)
    • [12].论词层级上说话人意义的形成因素[J]. 外语教学 2013(06)
    • [13].基于卷积长短期记忆网络的说话人辨识[J]. 信息通信 2020(08)
    • [14].说话人聚类的初始类生成方法[J]. 计算机工程与应用 2017(03)
    • [15].说话人视角下“来”的参照点问题再认识[J]. 语言教学与研究 2017(02)
    • [16].基于改进的深度神经网络的说话人辨认研究[J]. 电子器件 2017(05)
    • [17].基于语速差异的新闻发布会中首要说话人检测[J]. 计算机工程与应用 2015(04)
    • [18].一种多说话人角色聚类方法[J]. 华南理工大学学报(自然科学版) 2015(01)
    • [19].基于深层说话人矢量的说话人检索[J]. 华中科技大学学报(自然科学版) 2015(07)
    • [20].论说话人交际策略选择的影响因素[J]. 青年文学家 2014(27)
    • [21].汉语语音合成中说话人自适应的时长优化[J]. 清华大学学报(自然科学版) 2013(11)
    • [22].基于话者无关模型的说话人转换方法[J]. 模式识别与人工智能 2013(03)
    • [23].基于辨别性深度信念网络的说话人分割[J]. 清华大学学报(自然科学版) 2013(06)
    • [24].说话人分割聚类研究进展[J]. 信号处理 2013(09)
    • [25].新闻故事中的关键说话人发现方法[J]. 计算机工程与设计 2012(06)
    • [26].一种基于性别的说话人索引算法[J]. 计算机工程与科学 2012(06)
    • [27].基于NIST评测的说话人分类及定位技术研究[J]. 电子与信息学报 2011(05)
    • [28].说话人意义及其结构的研究维度——语言主观意义研究(一)[J]. 外语教学 2011(05)
    • [29].反讽话语说话人的意向及其常规推理[J]. 河北理工大学学报(社会科学版) 2010(02)
    • [30].用于说话人辨识的评分规整[J]. 计算机工程与应用 2010(12)

    标签:;  ;  ;  ;  

    噪声环境下说话人识别研究
    下载Doc文档

    猜你喜欢