论文摘要
说话人识别技术因其独特的方便性、经济性和准确性,在生物特征识别领域中具有广阔的应用前景。现有的说话人识别技术在理想条件下效果很好,但在实际环境中却由于各种因素的影响,不能得到普遍的应用,其中最重要的一个原因是大训练量和实时性不够。因此如何在不影响识别率的情况下,提高系统的训练时间和识别时间成为本领域的研究热点。SVM是一种基于结构风险最小化原则的模式分类方法,在处理样本中非线性、高维数问题时有很大的优势,应用于基于语音样本的说话人识别上有良好的效果。本文深入研究了SVM在说话识别中的大样本训练,及识别时需要匹配所有的参考模型等问题,并提出自己的解决方案。具体做了如下几方面的工作:1、针对标准SVM在说话人识别中的大样本训练问题,提出一个基于多约简支持向量机(MRSVM)的说话人辨识方法,既采用PCA变换和模糊核聚类分别减少训练样本的维数和个数,在不影响识别率的情况下,减少了标准SVM的训练量和系统存储量。2、提出一个基于PCA和MRSVM的多级说话人辨识方法,提高系统的辨识速度。利用PCA分类器具有无需训练、实现简单、快捷的优点。识别时用PCA对注册说话人进行快速预判决。利用SVM具有很强分类能力的优点,根据预判决的结果只判决一部分MRSVM的个数,从而减少了系统的辨识时间。相对于传统的识别方法,实验结果表明本文方法具有很大的时间优势,且整个系统具有很好的可扩性。
论文目录
摘要Abstract插图索引附表索引第一章 绪论1.1 课题背景1.2 说话人识别概念1.3 说话人识别研究现状1.3.1 技术研究现状1.3.2 应用研究现状1.4 本课题主要工作1.5 本论文内容安排第二章 说话人识别技术2.1 特征提取2.1.1 预处理2.1.2 线性预测系数(LPC)2.1.3 LPC倒谱系数(LPCC)2.1.4 Mel倒谱系数2.2 说话人识别模型2.2.1 模板匹配法2.2.2 概率模型法2.2.3 人工神经网络方法2.2.4 支持向量机2.2.4.1 最优分类面2.2.4.2 广义最优分类面2.2.4.3 核函数2.2.4.4 支持向量机2.3 本章小结第三章 基于MRSVM的说话人辨识3.1 约简支持向量机3.2 模糊核聚类3.3 主成分分析(PCA)3.3.1 主成分分析3.3.1.1 主成分分析的概念3.3.1.2 主成分的计算3.3.1.3 样本主成分3.3.1.4 主成分的选取3.4 多约简方法3.4.1 PCA降维3.4.2 选择样本3.4.3 训练SVM3.5 实验3.6 本章小结第四章 多级说话人辨识4.1 PCA分类器4.1.1 PCA分类原理4.1.2 PCA分类器原理4.2 多级识别方法4.3 实验4.4 本章小结总结参考文献致谢附录A 攻读硕士学位期间所发表的论文
相关论文文献
标签:说话人识别论文; 说话人辨识论文; 支持向量机论文; 变换论文; 模糊核聚类论文;