基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究

基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究

论文题目: 基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究

论文类型: 硕士论文

论文专业: 信号与信息处理

作者: 许百林

导师: 赵力

关键词: 说话人识别,矢量量化,高斯混合模型,倒谱系数,遗传算法

文献来源: 东南大学

发表年度: 2005

论文摘要: 说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点。说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中,使得说话人识别方面出现巨大发展。但它还远远没有成熟。本课题以语音信号的LPC倒谱系数、基音周期和维格纳-威利谱的混合特征参数作为识别的特征矢量集。运用矢量量化(VQ)和高斯混合模型(GMM)技术实现与文本有关及无关的说话人识别。在一个10人,2400个的语音库上进行了系统的识别实验。本论文的主要工作有:1、在说话人识别系统的语音特征参数提取部分,详细阐述了声道模型、线性预测编码(LPC)分析、LPC倒谱系数、MEL倒谱系数的求解;2、介绍了说话人识别的不同方法,主要介绍了矢量量化技术及其在说话人识别中的应用,其本质是在一个解空间中用少数的几个特殊的点来代表空间中全部的有效点,以达到编码、压缩的目的。同时,还介绍了高斯混合模型(GMM)的理论和实现,包括该模型的训练和识别;3、阐述了遗传算法的基本思想和处理方法。将遗传算法的全局优化与VQ技术、GMM技术结合起来,采用科学的编码方案,动态的定标技术,高效的交叉策略,得到了模型的优化作用,提高了说话人识别率。本篇论文从以上三方面讨论了说话人识别的理论,最后介绍了系统的实现与实验结果,并对实验结果进行了讨论、比较。

论文目录:

摘要

Abstract

第一章 绪论

1.1 说话人识别的基本概念及其分类

1.2 说话人识别的基本原理

1.3 说话人识别的应用领域

1.4 说话人识别的发展和现状

1.5 论文内容安排

第二章 说话人识别的特征参数分析及提取

2.1 概述

2.2 语音信号产生原理

2.3 基音周期估计

2.4 线性预测编码(LPC)分析

2.5 复倒谱和倒谱

2.6 MEL倒谱参数(Mel-Frequency Cepstral Coefficients: MFCC)

2.7 应用维格纳—威利谱提取特征参数

2.8 特征参数的评价方法

第三章 说话人识别系统的识别方法

3.1 概述

3.2 矢量量化方法(Vector Quantization)

3.2.1 矢量量化的原理

3.2.2 矢量量化器的最佳码本设计

3.2.3 矢量量化的LBG算法

3.2.4 初始码本的设置及畸变准则的选择

3.3 模糊矢量量化(Fuzzy Vector Quantization)

3.4 高斯混合模型方法(GMM)

3.4.1 GMM模型的基本概念

3.4.2 GMM模型的参数估计

3.4.3 训练数据不充分的问题

3.4.4 GMM模型的识别问题

第四章 遗传算法在矢量量化和高斯混合模型中的应用

4.1 遗传算法的概述

4.2 遗传算法的基本原理

4.3 GAVQ算法

4.3.1 基因编码

4.3.2 适应度函数选择

4.3.3 初始码本的形成

4.3.4 遗传操作

4.3.5 迭代停止条件

4.4 改进遗传算法在GMM中的应用

4.4.1 编码方案

4.4.2 适应度函数

4.4.3 遗传操作

4.4.4 改进的遗传算法的特点分析

第五章 系统实现与实验结果

5.1 概论

5.2 语音库的建立及语音信号的预处理

5.2.1 录音

5.2.2 语音库构成

5.2.3 数据采集

5.2.4 语音信号的预处理

5.3 应用矢量量化(VQ)的说话人识别

5.3.1 应用VQ的说话人识别过程

5.3.2 模糊矢量量化(Fuzzy VQ)的识别

5.3.3 应用GAVQ的说话人识别

5.3.4 GAVQ与VQ 的实验结果说明

5.4 应用GMM模型的识别

5.4.1 基于混合高斯模型的与文本无关说话人识别方法

5.4.2 应用GMM的识别结果

5.4.3 改进遗传算法应用于GMM识别

5.4.4 应用GAGMM识别结果

5.4.5 GAGMM与GMM的实验结果说明

结论

致谢

参考文献

研究生期间发表的论文

发布时间: 2007-06-11

参考文献

  • [1].利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究[D]. 王吉林.东南大学2004
  • [2].基于GMM和VQ的说话人识别系统的研究[D]. 林子明.华南理工大学2012
  • [3].基于GMM的说话人识别系统研究与实现[D]. 陈强.武汉理工大学2010
  • [4].基于GMM算法的说话人识别系统的研究[D]. 孙鹏.东北林业大学2014
  • [5].基于GMM的声纹识别系统研究[D]. 向权.哈尔滨理工大学2012
  • [6].基于GMM的说话人识别技术研究与实现[D]. 胡益平.厦门大学2007
  • [7].基于矢量量化(VQ)的说话人识别的研究[D]. 张玉娇.南京理工大学2015
  • [8].基于GMM的连接词语音识别及大词汇表系统的语言建模[D]. 祝嘉.苏州大学2006
  • [9].基于GMM说话人分类的说话人识别系统研究[D]. 李圆.华北电力大学(河北)2008
  • [10].基于改进的GMM和频率弯折的高质量语音转换算法的研究[D]. 崔立梅.南京邮电大学2017

相关论文

  • [1].基于矢量量化的说话人识别技术研究[D]. 黄文辉.西安电子科技大学2006
  • [2].基于MFCC的说话人识别系统研究[D]. 郭春霞.西安电子科技大学2006
  • [3].基于高斯混合模型的说话人识别系统的研究[D]. 王书诏.大连理工大学2006
  • [4].基于矢量量化(VQ)和人工神经网络(ANN)的说话人识别的研究[D]. 杨彦.东南大学2006
  • [5].说话人识别算法研究[D]. 李香萍.天津大学2006
  • [6].噪声环境下的基于GMM/SVM说话人识别算法[D]. 刘春山.哈尔滨工程大学2007
  • [7].基于VQ和GMM的与文本无关的说话人识别研究[D]. 陈伯胜.重庆大学2007
  • [8].说话人识别系统中语音特征参数提取方法的研究[D]. 甄挚.沈阳工业大学2007
  • [9].利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究[D]. 王吉林.东南大学2004
  • [10].基于MFCC和GMM的说话人识别系统研究[D]. 丁爱明.河海大学2006

标签:;  ;  ;  ;  ;  

基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究
下载Doc文档

猜你喜欢