基于自适应高斯混合模型说话人识别的研究

基于自适应高斯混合模型说话人识别的研究

论文摘要

随着移动通信设备,尤其是手机的流行,用户期望在这种设备上使用越来越多更广范围的计算技术。这些设备在各种环境中使用有不同的访问和操作需求,使得用户对语音输入的需求不断地增加。最近技术研究的进步大大提高了语音识别的鲁棒性和准确性,使得基于语音的人机互动接口更加流畅。语音也渐渐成为一种新的认证方式。如今先进的分布式处理的说话人识别可以使得只需在现行的移动设备上存储不大的有价值的信息(说话人模型),却又能实现很高的安全认证级别。本文的说话人确认系统架构于似然比测试的基础之上,使用VQOGMM作为功能函数,UBM(全局背景模型)来表示可变的说话人模型,和用自适应的Bayesian从UBM中提取最合理的说话人模型。本论文的目标是找到对于本系统最优化的语音倒谱特征量化器的设计。问题的难点在于如何在量化前和量化后实现对数似然比损失的最小化。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景及意义
  • 1.2 说话人识别概述
  • 1.3 性能评测的准则
  • 1.4 语音资料库
  • 1.5 论文安排
  • 2 基于VQOGMM的说话人识别
  • 2.1 高斯混合说话人模型(Gaussian Mixture Speaker Model)
  • 2.2 说话人确认的方法
  • 2.2.1 说话人确认
  • 2.2.2 阈值选取
  • 2.3 特征参数的正交转换
  • 2.3.1 正交转换的高斯混合模型延伸
  • 2.3.2 嵌入式高斯混合模型
  • 2.3.3 结合向量量化与特征参数正交转换的高斯混合模型
  • 2.4 VQOGMM的实验
  • 2.4.1 协方差矩阵形式的影响
  • 2.4.2 不同特征参数转换方式的比较
  • 2.4.3 传统GMM与VQOGMM的实验
  • 2.4.4 VQOGMM与其它转换方式的比较结果
  • 2.4.5 说话人确认实验
  • 2.5 小结
  • 3 基于自适应的VQOGMM-UBM说话人识别
  • 3.1 通用背景模型
  • 3.2 说话人模型自适应
  • 3.3 对数似然分
  • 3.4 自适应说话人识别系统实验
  • 3.4.1 传统的GMM与GMM-UBM性能的比较
  • 3.4.2 VQOGMM与VQOGMM-UBM性能的比较
  • 3.4.3 VQOGMM-UBM与GMM-UBM性能的比较
  • 3.5 小结
  • 4 说话人确认的量化
  • 4.1 使用VQOGMM-UBM的分布式说话人确认
  • 4.2 对数似然比绝对值失真量化器
  • 4.2.1 矢量的量化的原理
  • 4.2.2 传统的MSE量化器
  • 4.2.3 简化对数似然比
  • 4.2.4 在译码器中计算对数似然比
  • 4.2.5 对数似然比量化器的设计
  • 4.2.6 对多个说话人的量化
  • 4.3 可变比特分布
  • 4.3.1 聚类比特分布最优化原则
  • 4.3.2 单个说话人的确认
  • 4.3.3 多个说话人的确认
  • 4.3.4 比特分布的进一步改进
  • 4.4 分布式说话人识别
  • 4.5 实验
  • 4.6 小结
  • 5 结束语
  • 5.1 本文工作总结
  • 5.2 进一步的研究工作
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  

    基于自适应高斯混合模型说话人识别的研究
    下载Doc文档

    猜你喜欢