基于VQ与HMM的说话人识别技术研究

基于VQ与HMM的说话人识别技术研究

论文摘要

说话人识别是根据语音信号中反映说话人生理和行为的个性特征自动鉴别说话人身份的一种生物认证技术,可广泛应用于电话银行、数据库访问、计算机远程登录、安全验证、自动控制等领域,正因为说话人识别具有如此广阔的应用前景,近年来在生物认证技术领域中越来越受到人们的关注。如何获取有效的说话人个性特征和选择合理的说话人识别方法以提高说话人识别系统的识别率和可靠性,是本论文的主要研究内容。本文通过分析说话人识别基本原理与系统结构,考察现有的说话人识别技术,研究基于线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)与Mel频率倒谱系数(MelFrequency Cepstrum Coefficient,MFCC)的二次特征提取方法,以及矢量量化(Vector Quantization,VQ)与隐马儿可夫模型(Hidden Markov Model,HMM)相结合的识别方法。本文设计的系统是文本相关的说话人识别系统。为了得到有效的语音段和较好地提取说话人特征参数,首先对说话人的语音信号进行去噪、预加重、分帧、加窗和端点检测等预处理,对LPCC和MFCC进行特征加权、特征差分、特征组合以及特征筛选获得二次特征参数,并在HMM模型前端采用VQ技术为每一个说话人设计码书,避免引起误差积累效应,最后采用Baum-Welch算法和Viterbi算法分别对说话人进行训练和识别。实验证明,采用基于LPCC和MFCC的二次特征参数,以及VQ与HMM模型相结合方法的说话人识别系统具有识别率高,差错率低的优点。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 说话人识别的发展及现状
  • 1.3 说话人识别的应用前景
  • 1.4 说话人识别的难点
  • 1.5 本文主要工作和研究内容
  • 1.6 本章小结
  • 第2章 说话人识别系统原理
  • 2.1 语音信号的产生与感知
  • 2.1.1 语音的发声机理
  • 2.1.2 人耳的听觉感知特性
  • 2.1.3 语音信号的数字模型
  • 2.2 语音信号的预处理
  • 2.2.1 语音采样
  • 2.2.2 去除噪音
  • 2.2.3 预加重处理
  • 2.2.4 分帧和加窗
  • 2.2.5 端点检测
  • 2.3 说话人特征参数提取
  • 2.3.1 常用的说话人特征参数
  • 2.3.2 线性预测倒谱系数
  • 2.3.3 Mel频率倒谱系数
  • 2.4 说话人识别方法
  • 2.4.1 基于模板的识别方法
  • 2.4.2 基于概率统计的识别方法
  • 2.4.3 基于人工神经网络的识别方法
  • 2.4.4 基于支持向量机的识别方法
  • 2.5 本章小结
  • 第3章 矢量量化与隐马尔可夫模型
  • 3.1 矢量量化
  • 3.1.1 矢量量化的基本原理
  • 3.1.2 LBG算法
  • 3.1.3 初始码本的设置方法
  • 3.1.4 基于矢量量化的说话人识别
  • 3.2 隐马尔可夫模型
  • 3.2.1 Markov链
  • 3.2.2 HMM模型的定义
  • 3.2.3 HMM的基本算法
  • 3.2.4 HMM算法实现中的问题
  • 3.2.5 基于 HMM模型的说话人识别
  • 3.3 本章小结
  • 第4章 基于VQ与HMM的说话人识别系统实现
  • 4.1 说话人识别系统的性能评价
  • 4.2 语音信号的预处理过程
  • 4.3 基于LPCC与 MFCC的二次特征提取
  • 4.3.1 LPCC及其差分提取
  • 4.3.2 MFCC及其差分提取
  • 4.3.3 LPCC与 MFCC的二次特征提取
  • 4.4 基于VQ与 HMM的说话人识别系统实现
  • 4.5 本章小结
  • 第5章 系统仿真及分析
  • 5.1 系统开发环境
  • 5.1.1 硬件环境
  • 5.1.2 软件环境
  • 5.1.3 MATLAB简介
  • 5.2 仿真结果及分析
  • 5.2.1 语音信号的预处理和特征参数提取仿真实验
  • 5.2.2 单一特征维数的影响仿真实验
  • 5.2.3 不同特征参数组合仿真实验
  • 5.2.4 不同说话人识别模型仿真实验
  • 5.2.5 不同训练和测试语音时长仿真实验
  • 5.3 本章小结
  • 第6章 总结与展望
  • 6.1 本文主要工作和创新点
  • 6.2 后续工作展望
  • 参考文献
  • 附录
  • 致谢
  • 作者简介
  • 攻读硕士期间发表的论文和科研成果
  • 相关论文文献

    • [1].基于HMM的缝洞型油藏产量预测算法[J]. 西南大学学报(自然科学版) 2020(02)
    • [2].基于HMM模型的藏语词性标注研究[J]. 信息通信 2020(05)
    • [3].基于HMM的矿井提升机故障诊断方法[J]. 煤炭技术 2017(02)
    • [4].基于HMM的连续语音识别系统的构建与研究[J]. 长春大学学报 2015(02)
    • [5].HMM再次实现季度盈利[J]. 中国航务周刊 2020(48)
    • [6].基于二阶HMM的中医诊断古文词性标注[J]. 计算机工程 2017(07)
    • [7].基于HMM模型的藏语语音合成研究[J]. 计算机应用与软件 2015(05)
    • [8].浅谈HMM在词性标注中的应用[J]. 电脑开发与应用 2011(03)
    • [9].基于HMM中文词性标注研究[J]. 金陵科技学院学报 2017(01)
    • [10].基于HMM的机载设备状态健康评估方法研究[J]. 计算机测量与控制 2015(02)
    • [11].基于HMM的柯尔克孜语词性标注的研究[J]. 计算机工程与应用 2014(15)
    • [12].改进的HMM应用于哈萨克语词性标注[J]. 计算机工程与应用 2010(36)
    • [13].复杂网络攻击的HMM检测模型[J]. 计算机工程 2009(12)
    • [14].基于隐马尔可夫模型(HMM)的系统调用异常检测[J]. 太原科技大学学报 2008(01)
    • [15].HMM模型在检测复杂网络攻击中的应用[J]. 计算机工程与应用 2008(07)
    • [16].基于HMM的维吾尔语词性标注研究[J]. 现代计算机(专业版) 2017(07)
    • [17].HMM词性标注中高频生词的处理[J]. 计算机应用与软件 2014(02)
    • [18].基于HMM的主题垂直搜索引擎技术研究[J]. 自动化技术与应用 2014(10)
    • [19].基于多观察序列的HMM训练算法[J]. 湖北工程学院学报 2013(03)
    • [20].语音分离与HMM相结合的语音增强方法[J]. 计算机工程与应用 2013(16)
    • [21].基于HMM的哈萨克语词性标注研究[J]. 计算机应用与软件 2012(02)
    • [22].应用HMM识别在线协作交互模式[J]. 现代教育技术 2008(07)
    • [23].基于HMM的交通事件检测探讨[J]. 现代商贸工业 2008(13)
    • [24].基于HMM的基因剪接供体位点识别改进研究[J]. 科技创新导报 2008(18)
    • [25].基于节点生长马氏距离K均值和HMM的网络入侵检测方法设计[J]. 计算机测量与控制 2014(10)
    • [26].基于HMM的交叉口交通事件预测研究[J]. 交通运输系统工程与信息 2013(06)
    • [27].基于HMM的手势识别研究[J]. 华中师范大学学报(自然科学版) 2012(05)
    • [28].使用HMM模型改进规则自动生成的命名实体识别系统性能[J]. 中小企业管理与科技(下旬刊) 2010(01)
    • [29].隐马尔可夫模型(HMM)及其应用[J]. 湖南科技学院学报 2009(04)
    • [30].HMM模型在语音识别研究中的应用[J]. 电脑知识与技术 2008(34)

    标签:;  ;  ;  ;  ;  

    基于VQ与HMM的说话人识别技术研究
    下载Doc文档

    猜你喜欢