基于LonWorks总线技术的说话人识别系统研究与实现

基于LonWorks总线技术的说话人识别系统研究与实现

论文摘要

语音识别技术是一门涉及信号处理技术、模式识别、概率论和信息论、语音学、人工智能等多种学科的交叉科学。近年来随着语音识别理论研究的深入和数字信号处理软硬件技术的发展,语音识别技术已逐步具备走出实验室,服务于社会的能力。说话人识别技术是语音识别技术的一种,共分为说话人确认和说话人辨认两种。与语音识别不同的是,说话人识别系统力求选取那些话者间差异大而话者本身的差异小的参数或参数组合。80年代后期,埃施朗公司(Echelon)为开发控制网的通用标准而设计了LonWorks技术平台。它通过使用LonTalk协议来完成系列任务,如今LonWorks技术已经成为控制网的通用标准。为了经济、标准化布置,埃施朗公司设计了神经元芯片。神经元芯片提供了通信协议ISO/OSI模型的前六层,用户只需要提供应用层编程和配置。这就使协议实施标准化,并使得开发和配置较为容易。在某些复杂的应用中,处理器速度和神经元系列的最大存储器容量不足以完成LonWorks节点要求的功能。为了适应这些应用,某些类型的神经元芯片拥有高速并行接口,使任何微处理器能使用神经元芯片。此外,LonTalk协议可移植在任何处理器上运行。本文主要进行了基于LonWorks技术的说话人识别系统的设计和实现,LonWorks网络是由众多智能节点通过双绞线直接连接形成,单个智能节点都是一个说话人识别系统。神经元芯片选用了Motorola公司生产的MC143120DW芯片,其内部集成了三个管线CPU,一个用于执行用户编写的应用程序,另外两个完成网络通信任务。该芯片使用Node Builder作为它的软件开发平台,该平台将Neuron C语言编辑、编译汇编、连接及调试等功能于一体,用户可以很方便的开发各种应用系统。单个节点的语音处理芯片选用TI的TMS320VC5402,语音的特征参数采用基音周期、线性预测倒谱系数和两者的组合。在神经元芯片所连接按键的控制下,经DTW模板匹配法分别进行的测验,得出结果由与神经元芯片相连的LED显示。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 语音识别技术的发展概况和现状
  • 1.2 语音识别技术的分类及应用
  • 1.3 语音识别技术面临的困难
  • 1.4 本文的研究内容
  • 1.5 章节安排
  • 第二章 语音识别技术基本理论
  • 2.1 语音信号的基本知识
  • 2.1.1 语音产生的生理机构与过程
  • 2.1.2 语音信号的系统模型
  • 2.1.3 可视化语音—语谱图的介绍
  • 2.2 说话人识别系统的基本结构
  • 2.3 语音信号的数字化和预处理
  • 2.4 语音信号的端点检测
  • 2.5 语音信号的特征参数
  • 2.5.1 基音周期
  • 2.5.2 线性预测倒谱系数(LPCC)
  • 2.6 动态时间规整算法
  • 2.6.1 说话人识别的基本方法
  • 2.6.2 动态时间规整(DTW)方法
  • 2.6.3 模板匹配法的训练方法
  • 2.7 小结
  • 第三章 LONWORKS技术
  • 3.1 控制网
  • 3.2 LonTalk协议
  • 3.2.1 协议定义
  • 3.2.2 协议寻址
  • 3.2.3 网络变量
  • 3.2.4 报文类型
  • 3.2.5 信道类型
  • 3.3 神经元芯片
  • 3.4 神经元芯片编程语言
  • 3.5 收发器
  • 3.6 路由器
  • 3.7 LonWorks物理网络组成及其特点
  • 3.8 小结
  • 第四章 系统实现
  • 4.1 神经元 MC143120DW
  • 4.2 TMS320VC5402介绍
  • 4.3 模数接口设计
  • 4.3.1 TLC320AD50芯片
  • 4.3.2 模数接口的硬件电路设计
  • 4.4 外部存储器的扩展
  • 4.4.1 外部数据存储器设计
  • 4.4.2 外部程序存储器的扩展
  • 4.5 电源模块
  • 4.6 DSP与 MC143120DW连接电路
  • 4.6.1 MC143120DW与 VC5402接口电路
  • 4.6.2 MC143120DW键盘与 LED接口
  • 4.7 小结
  • 第五章 系统的软件设计
  • 5.1 系统初始化
  • 5.1.1 TMS320VC5402、MC143120DW内部寄存器初始化
  • 5.1.2 TMS320VC5402缓冲串口初始化
  • 5.1.3 TLC320AD50的初始化
  • 5.2 按键识别
  • 5.3 预处理及端点检测
  • 5.4 特征参数与识别算法
  • 5.4.1 基音周期(T)
  • 5.4.2 线性预测倒谱系数(LPCC)
  • 5.4.3 DTW模板匹配法
  • 5.5 实验结果与分析
  • 5.6 小结
  • 第六章 结论与展望
  • 附录1 系统框图
  • 附录2 部分程序代码
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    基于LonWorks总线技术的说话人识别系统研究与实现
    下载Doc文档

    猜你喜欢