论文摘要
随着移动通信设备,尤其是手机的流行,用户期望在这种设备上使用越来越多更广范围的计算技术。这些设备在各种环境中使用有不同的访问和操作需求,使得用户对语音输入的需求不断地增加。最近技术研究的进步大大提高了语音识别的鲁棒性和准确性,使得基于语音的人机互动接口更加流畅。语音也渐渐成为一种新的认证方式。如今先进的分布式处理的说话人识别可以使得只需在现行的移动设备上存储不大的有价值的信息(说话人模型),却又能实现很高的安全认证级别。本文的说话人确认系统架构于似然比测试的基础之上,使用VQOGMM作为功能函数,UBM(全局背景模型)来表示可变的说话人模型,和用自适应的Bayesian从UBM中提取最合理的说话人模型。本论文的目标是找到对于本系统最优化的语音倒谱特征量化器的设计。问题的难点在于如何在量化前和量化后实现对数似然比损失的最小化。
论文目录
摘要Abstract1 绪论1.1 研究背景及意义1.2 说话人识别概述1.3 性能评测的准则1.4 语音资料库1.5 论文安排2 基于VQOGMM的说话人识别2.1 高斯混合说话人模型(Gaussian Mixture Speaker Model)2.2 说话人确认的方法2.2.1 说话人确认2.2.2 阈值选取2.3 特征参数的正交转换2.3.1 正交转换的高斯混合模型延伸2.3.2 嵌入式高斯混合模型2.3.3 结合向量量化与特征参数正交转换的高斯混合模型2.4 VQOGMM的实验2.4.1 协方差矩阵形式的影响2.4.2 不同特征参数转换方式的比较2.4.3 传统GMM与VQOGMM的实验2.4.4 VQOGMM与其它转换方式的比较结果2.4.5 说话人确认实验2.5 小结3 基于自适应的VQOGMM-UBM说话人识别3.1 通用背景模型3.2 说话人模型自适应3.3 对数似然分3.4 自适应说话人识别系统实验3.4.1 传统的GMM与GMM-UBM性能的比较3.4.2 VQOGMM与VQOGMM-UBM性能的比较3.4.3 VQOGMM-UBM与GMM-UBM性能的比较3.5 小结4 说话人确认的量化4.1 使用VQOGMM-UBM的分布式说话人确认4.2 对数似然比绝对值失真量化器4.2.1 矢量的量化的原理4.2.2 传统的MSE量化器4.2.3 简化对数似然比4.2.4 在译码器中计算对数似然比4.2.5 对数似然比量化器的设计4.2.6 对多个说话人的量化4.3 可变比特分布4.3.1 聚类比特分布最优化原则4.3.2 单个说话人的确认4.3.3 多个说话人的确认4.3.4 比特分布的进一步改进4.4 分布式说话人识别4.5 实验4.6 小结5 结束语5.1 本文工作总结5.2 进一步的研究工作致谢参考文献
相关论文文献
标签:说话人识别论文; 量化论文;