定点化与文本无关的说话人识别系统

定点化与文本无关的说话人识别系统

论文摘要

说话人识别,是根据应用语音波形中反映说话人生理和行为的语音特征参数,自动鉴别说话人身份的一种技术。作为生物认证技术的一种,与其它生物识别技术相比,说话人识别具有更为简便,经济及可扩展性良好等众多优势,可广泛应用于安全验证、电话银行、数据库访问、计算机远程登录、控制等领域.正因为说话人识别具有如此广阔的应用前景,近年来越来越受到研究者的关注。本课题模拟定点芯片环境下的系统实现。在使用嵌入式系统实现语音、数字信号处理时,经常是采用定点实现。数字信号的定点实现不使用浮点数、浮点指令,完全由定点数和定点指令来实现。定点程序需要的硬件配置低、成本低,速度更快,所需要的时间更短,提供更为实时、可靠的计算。本文首先介绍了说话人识别系统的概念,分析了几种常用的语音特征参数和说话人识别的几种模型。重点研究了用于与文本无关的说话人识别的矢量量化模型(VQ)。然后说明了说话人识别系统算法的定点化实现方法。算法的定点化实现需要解决程序动态变量的定标值的确定,线性运算的定点化,和非线性运算的定点化等问题,探讨了算法的定点化实现的一些原则。最后说明了定点化说话人识别系统的实现过程。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的研究背景及意义
  • 1.2 说话人识别的发展历史与国内外研究现状
  • 1.2.1 发展历史
  • 1.2.2 国内外研究现状
  • 1.2.3 嵌入式,语音识别技术的新趋向
  • 1.3 定点化应用
  • 1.4 本文的研究内容
  • 第2章 说话人识别的研究内容
  • 2.1 说话人识别的基本原理
  • 2.2 说话人识别的分类
  • 2.3 说话人识别的特征参数
  • 2.4 说话人识别的主要方法
  • 2.4.1 模板匹配方法
  • 2.4.2 概率统计方法
  • 2.4.3 辨别分类器法
  • 2.4.4 混合方法
  • 2.5 语音信号的分析方法
  • 2.5.1 时域分析
  • 2.5.2 频域分析
  • 2.5.3 语谱分析
  • 2.5.4 倒谱分析
  • 2.6 本章小结
  • 第3章 基于MFCC 和VQ 的说话人识别研究
  • 3.1 Mel 频率倒谱系数(MFCC)
  • 3.1.1 Mel 频率倒谱系数介绍
  • 3.1.2 提取Mel 频率倒谱系数
  • 3.2 基于矢量量化的模式匹配方法
  • 3.2.1 矢量量化的基本原理
  • 3.2.2 矢量量化中码书的设计
  • 3.2.3 矢量量化的失真测度
  • 3.3 本章小结
  • 第4章 定点算术运算
  • 4.1 数的定标
  • 4.2 定点运算实现的基本原理
  • 4.2.1 加法/减法运算的C 语音定点模拟
  • 4.2.2 乘法运算的C 语音定点模拟
  • 4.2.3 除法运算的定点化模拟
  • 4.2.4 程序变量的定标值的确定
  • 4.3 非线性运算的定点快速实现
  • 4.4 本章小结
  • 第5章 定点化与文本无关的说话人识别的实现
  • 5.1 系统的设计目标
  • 5.2 说话人识别系统的一般实现
  • 5.2.1 语音信号的预处理
  • 5.2.2 基于矢量量化的说话人识别系统
  • 5.3 算法的定点化实现
  • 5.3.1 定点化实现的一些原则
  • 5.3.2 浮点数到定点数的转化
  • 5.3.3 定点化的FFT 算法
  • 5.4 系统的实验结果
  • 5.4.1 实现系统的软硬件平台
  • 5.4.2 实验结果的分析
  • 5.5 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 个人简历
  • 相关论文文献

    标签:;  ;  ;  ;  

    定点化与文本无关的说话人识别系统
    下载Doc文档

    猜你喜欢