论文摘要
说话人认证是一项通过计算机来对用户身份进行认证的技术,可以分为声纹认证和内容验证,本论文主要在信道鲁棒的特征提取、说话人确认和语义信息验证三个方面进行了电话信道下的说话人认证的研究,主要工作内容概括如下:1.针对电话信道下的说话人确认,作者首先研究了常用的几种信道均衡算法,实验结果表明,经过RASTA滤波器后的PLP参数再通过倒谱方差归一能够对信道卷积噪声有着很好的抑制。接着本文以此为基线系统,提出了一种基于互相关信息的特征选择算法,选择最佳的特征表示,最后通过线性判别分析对所选取的特征进行区分性变换,实验表明,经过这两个步骤后,系统的错误拒绝率下降了17.4%。2.在运用文本相关的说话人确认技术中,本文分别研究了VQ、DTW和HMM三项传统的技术,并提出了将背景矢量量化码本作为其中DTW和VQ方法的背景模型,实验表明,当使用5个训练样本时,码本归一化使得这两种方法的平均错误率分别下降了18.6%和27.0%。同时本文还采用基频、能量和时长特征与此三个系统结合,使用了多层神经网络和AdaBoost增强学习算法对得分进行分类,分类后的性能又获得了进一步的提高。3.语义信息验证技术将语音与用户预存的文本进行比对验证,以判别未知说话人是否拥有声称用户的知识。说话验证是常见的实现方案,在本文中,作者采用了多层次的置信度检验公式,在不同级别的声学层次和声学模型上对声音进行验证打分,最后系统将这些得分融入到神经网络和AdaBoost增强分类器中,和单个分类器相比,系统的平均错误率下降了23%。同时本文还将零规整和文本相关的阈值归一化方法结合,平均错误率从原先的1.39%降低到了0.58%。4.本文对说话人认证的应用方案做了分析和研究,讨论了语义内容,声纹信息和安全性的关系,最后在说话人认证的实验中将说话人确认技术和语义信息验证技术结合。当冒充者未知用户密码时,保证了仅提问一个问题时系统的虚警率为0.02%,同时目标说话人的正确接受率达到98%。
论文目录
摘要ABSTRACT第一章 绪论1.1 文本相关说话人认证概述1.2 说话人认证研究现状1.3 评测方法介绍1.4 研究工作概述1.5 论文组织结构第二章 信道鲁棒的特征提取2.1 语音端点检测2.2 基本声学参数提取2.2.1 感知线性预测系数2.2.2 相对谱滤波器2.2.3 动态特征2.3 信道均衡2.3.1 倒谱均值归一2.3.2 倒谱方差归一2.3.3 特征弯折2.4 特征选取与特征变换2.4.1 l-r选择算法2.4.2 基于互相关信息的特征选取2.4.3 线性判别分析2.5 实验结果与分析第三章 说话人确认技术3.1 说话人确认的数学基础3.1.1 贝叶斯准则与假设检验3.1.2 说话人确认框架3.2 矢量量化3.2.1 基于LBG算法的码本设计3.2.2 背景码本归一化3.3 动态时间弯折3.3.1 基于动态时间弯折的说话人确认系统3.3.2 背景弯折路径与矢量量化码本归一化3.4 隐马尔可夫模型3.4.1 分段 K均值算法训练3.4.2 维特比译码与背景模型3.5 基于多层神经网络的系统融合技术3.5.1 多层神经网络模型3.5.2 AdaBoost集成学习算法3.6 实验结果与分析第四章 语义信息验证技术4.1 系统概述4.1.1 语义验证方案4.1.2 说话验证4.2 置信度检验4.2.1 在线垃圾模型4.2.2 反词模型4.2.3 多层次置信度检验4.3 得分融合与文本归一化方法4.3.1 基于模式分类方法的系统融合4.3.2 零规整4.3.3 文本相关阈值归一4.4 实验结果与分析第五章 说话人认证系统5.1 结合说话人确认和语义信息验证的系统框架5.2 语义内容,声纹信息和安全性的关系5.3 实验结果与分析第六章 总结与展望6.1 论文工作总结6.2 下一步研究展望参考文献致谢作者攻读学位期间发表的学术论文目录
相关论文文献
标签:说话人确认论文; 语义信息验证论文; 隐马尔可夫模型论文; 得分归一化论文; 置信度检验论文;