论文摘要
语音识别技术是一门涉及信号处理技术、模式识别、概率论和信息论、语音学、人工智能等多种学科的交叉科学。近年来随着语音识别理论研究的深入和数字信号处理软硬件技术的发展,语音识别技术已逐步具备走出实验室,服务于社会的能力。说话人识别技术是语音识别技术的一种,共分为说话人确认和说话人辨认两种。与语音识别不同的是,说话人识别系统力求选取那些话者间差异大而话者本身的差异小的参数或参数组合。80年代后期,埃施朗公司(Echelon)为开发控制网的通用标准而设计了LonWorks技术平台。它通过使用LonTalk协议来完成系列任务,如今LonWorks技术已经成为控制网的通用标准。为了经济、标准化布置,埃施朗公司设计了神经元芯片。神经元芯片提供了通信协议ISO/OSI模型的前六层,用户只需要提供应用层编程和配置。这就使协议实施标准化,并使得开发和配置较为容易。在某些复杂的应用中,处理器速度和神经元系列的最大存储器容量不足以完成LonWorks节点要求的功能。为了适应这些应用,某些类型的神经元芯片拥有高速并行接口,使任何微处理器能使用神经元芯片。此外,LonTalk协议可移植在任何处理器上运行。本文主要进行了基于LonWorks技术的说话人识别系统的设计和实现,LonWorks网络是由众多智能节点通过双绞线直接连接形成,单个智能节点都是一个说话人识别系统。神经元芯片选用了Motorola公司生产的MC143120DW芯片,其内部集成了三个管线CPU,一个用于执行用户编写的应用程序,另外两个完成网络通信任务。该芯片使用Node Builder作为它的软件开发平台,该平台将Neuron C语言编辑、编译汇编、连接及调试等功能于一体,用户可以很方便的开发各种应用系统。单个节点的语音处理芯片选用TI的TMS320VC5402,语音的特征参数采用基音周期、线性预测倒谱系数和两者的组合。在神经元芯片所连接按键的控制下,经DTW模板匹配法分别进行的测验,得出结果由与神经元芯片相连的LED显示。
论文目录
摘要ABSTRACT第一章 绪论1.1 语音识别技术的发展概况和现状1.2 语音识别技术的分类及应用1.3 语音识别技术面临的困难1.4 本文的研究内容1.5 章节安排第二章 语音识别技术基本理论2.1 语音信号的基本知识2.1.1 语音产生的生理机构与过程2.1.2 语音信号的系统模型2.1.3 可视化语音—语谱图的介绍2.2 说话人识别系统的基本结构2.3 语音信号的数字化和预处理2.4 语音信号的端点检测2.5 语音信号的特征参数2.5.1 基音周期2.5.2 线性预测倒谱系数(LPCC)2.6 动态时间规整算法2.6.1 说话人识别的基本方法2.6.2 动态时间规整(DTW)方法2.6.3 模板匹配法的训练方法2.7 小结第三章 LONWORKS技术3.1 控制网3.2 LonTalk协议3.2.1 协议定义3.2.2 协议寻址3.2.3 网络变量3.2.4 报文类型3.2.5 信道类型3.3 神经元芯片3.4 神经元芯片编程语言3.5 收发器3.6 路由器3.7 LonWorks物理网络组成及其特点3.8 小结第四章 系统实现4.1 神经元 MC143120DW4.2 TMS320VC5402介绍4.3 模数接口设计4.3.1 TLC320AD50芯片4.3.2 模数接口的硬件电路设计4.4 外部存储器的扩展4.4.1 外部数据存储器设计4.4.2 外部程序存储器的扩展4.5 电源模块4.6 DSP与 MC143120DW连接电路4.6.1 MC143120DW与 VC5402接口电路4.6.2 MC143120DW键盘与 LED接口4.7 小结第五章 系统的软件设计5.1 系统初始化5.1.1 TMS320VC5402、MC143120DW内部寄存器初始化5.1.2 TMS320VC5402缓冲串口初始化5.1.3 TLC320AD50的初始化5.2 按键识别5.3 预处理及端点检测5.4 特征参数与识别算法5.4.1 基音周期(T)5.4.2 线性预测倒谱系数(LPCC)5.4.3 DTW模板匹配法5.5 实验结果与分析5.6 小结第六章 结论与展望附录1 系统框图附录2 部分程序代码参考文献攻读硕士学位期间发表的论文致谢
相关论文文献
标签:说话人识别论文; 现场总线论文; 神经元芯片论文; 基音周期论文; 线性预测倒谱系数论文; 动态时间规整方法论文;
基于LonWorks总线技术的说话人识别系统研究与实现
下载Doc文档