文本相关的说话人认证系统

论文摘要

说话人认证是一项通过计算机来对用户身份进行认证的技术，可以分为声纹认证和内容验证，本论文主要在信道鲁棒的特征提取、说话人确认和语义信息验证三个方面进行了电话信道下的说话人认证的研究，主要工作内容概括如下：1．针对电话信道下的说话人确认，作者首先研究了常用的几种信道均衡算法，实验结果表明，经过RASTA滤波器后的PLP参数再通过倒谱方差归一能够对信道卷积噪声有着很好的抑制。接着本文以此为基线系统，提出了一种基于互相关信息的特征选择算法，选择最佳的特征表示，最后通过线性判别分析对所选取的特征进行区分性变换，实验表明，经过这两个步骤后，系统的错误拒绝率下降了17.4％。2．在运用文本相关的说话人确认技术中，本文分别研究了VQ、DTW和HMM三项传统的技术，并提出了将背景矢量量化码本作为其中DTW和VQ方法的背景模型，实验表明，当使用5个训练样本时，码本归一化使得这两种方法的平均错误率分别下降了18.6％和27.0％。同时本文还采用基频、能量和时长特征与此三个系统结合，使用了多层神经网络和AdaBoost增强学习算法对得分进行分类，分类后的性能又获得了进一步的提高。3．语义信息验证技术将语音与用户预存的文本进行比对验证，以判别未知说话人是否拥有声称用户的知识。说话验证是常见的实现方案，在本文中，作者采用了多层次的置信度检验公式，在不同级别的声学层次和声学模型上对声音进行验证打分，最后系统将这些得分融入到神经网络和AdaBoost增强分类器中，和单个分类器相比，系统的平均错误率下降了23％。同时本文还将零规整和文本相关的阈值归一化方法结合，平均错误率从原先的1.39％降低到了0.58％。4．本文对说话人认证的应用方案做了分析和研究，讨论了语义内容，声纹信息和安全性的关系，最后在说话人认证的实验中将说话人确认技术和语义信息验证技术结合。当冒充者未知用户密码时，保证了仅提问一个问题时系统的虚警率为0.02％，同时目标说话人的正确接受率达到98％。

论文目录

摘要

ABSTRACT

第一章绪论

1.1 文本相关说话人认证概述

1.2 说话人认证研究现状

1.3 评测方法介绍

1.4 研究工作概述

1.5 论文组织结构

第二章信道鲁棒的特征提取

2.1 语音端点检测

2.2 基本声学参数提取

2.2.1 感知线性预测系数

2.2.2 相对谱滤波器

2.2.3 动态特征

2.3 信道均衡

2.3.1 倒谱均值归一

2.3.2 倒谱方差归一

2.3.3 特征弯折

2.4 特征选取与特征变换

2.4.1 l-r选择算法

2.4.2 基于互相关信息的特征选取

2.4.3 线性判别分析

2.5 实验结果与分析

第三章说话人确认技术

3.1 说话人确认的数学基础

3.1.1 贝叶斯准则与假设检验

3.1.2 说话人确认框架

3.2 矢量量化

3.2.1 基于LBG算法的码本设计

3.2.2 背景码本归一化

3.3 动态时间弯折

3.3.1 基于动态时间弯折的说话人确认系统

3.3.2 背景弯折路径与矢量量化码本归一化

3.4 隐马尔可夫模型

3.4.1 分段 K均值算法训练

3.4.2 维特比译码与背景模型

3.5 基于多层神经网络的系统融合技术

3.5.1 多层神经网络模型

3.5.2 AdaBoost集成学习算法

3.6 实验结果与分析

第四章语义信息验证技术

4.1 系统概述

4.1.1 语义验证方案

4.1.2 说话验证

4.2 置信度检验

4.2.1 在线垃圾模型

4.2.2 反词模型

4.2.3 多层次置信度检验

4.3 得分融合与文本归一化方法

4.3.1 基于模式分类方法的系统融合

4.3.2 零规整

4.3.3 文本相关阈值归一

4.4 实验结果与分析

第五章说话人认证系统

5.1 结合说话人确认和语义信息验证的系统框架

5.2 语义内容，声纹信息和安全性的关系

5.3 实验结果与分析

第六章总结与展望

6.1 论文工作总结

6.2 下一步研究展望

参考文献

致谢

作者攻读学位期间发表的学术论文目录

文本相关的说话人认证系统

论文摘要

论文目录

相关论文文献

猜你喜欢