论文摘要
近年来随着语音识别理论研究的深入和超大规模集成电路技术与计算机技术的快速发展,己可以满足实时信号处理的要求。语音识别技术应用的研究越来越受到人们的关注,现在已经广泛应用到控制、通信和消费等行业,随着语音信号处理技术的发展,语音识别技术将得到更广泛的应用。因此,进行语音识别的研究工作具有实际意义和广阔的应用前景。论文研究的是基于DSP的声控系统,主要进行非特定人的孤立词识别,从而实现声音命令的控制,分别对语音识别系统的算法、硬件电路设计和软件编写做了详细阐述。首先介绍了语音识别技术在国内外的发展状况,阐明了本课题的研究背景和意义,并在此基础上,根据语音识别系统的构成模型,介绍了语音识别的基本理论。包括语音信号预处理;语音的端点检测,在研究比较了传统的端点检测方法的基础上提出了双门限比较方法;特征提取,重点分析了LPC倒谱系数和Mel倒谱系数;介绍了语音识别算法DTW和HMM,并做了深入的研究与分析。其次简单阐述了TI公司的DSP,并在借鉴已有的成熟理论的基础上,提出了相应的语音识别系统方案。语音信号通过A/D转换,将转换后的数字信号传送给DSP进行处理和识别,识别结果输出到由CPLD实现的后续控制电路部分,重点设计了信号处理模块、语音采集模块、存储扩展模块、CPLD控制模块、电源模块等。在软件算法上,采用双门限法进行语音端点检测,采用Mel倒谱系数作为语音信号特征矢量。另外,根据孤立词识别算法DTW和HMM的比较结果并考虑本系统的特点,采用隐马尔可夫模型(HMM),利用Baum-Welth重估算法、前向后向算法、viterbi算法来完成语音模板的训练和语音识别的任务。文中简要介绍了系统的开发环境,并在此基础上,完成了程序的设计和调试,验证了算法的可行性,并对程序做了优化设计。最后对全文进行总结,指出了今后工作和待研究的方向。
论文目录
摘要Abstract第一章 绪论1.1 课题的背景及意义1.2 语音识别的研究现状1.3 语音识别的难点1.4 论文的主要研究内容第二章 语音识别的基本理论2.1 语音识别系统的组成2.2 语音信号的预处理2.2.1 语音信号的采样和预处理2.2.2 语音信号的预加重2.2.3 语音信号的加窗2.3 语音信号的特征参数提取2.3.1 线性预测倒谱LPCC2.3.2 美尔倒谱特征参数MFCC2.3.3 复倒谱和倒谱2.4 孤立词语音识别算法2.4.1 动态时间规整(DTW)2.4.2 HMM 模型2.4.3 算法比较2.5 本章小结第三章 声控系统的硬件设计3.1 声控系统硬件设计3.2 信号处理单元TMS320VC5416 DSP3.3 语音采集模块设计3.3.1 Codec 的控制接口设计3.3.2 数据接口的设计3.4 电源模块设计3.5 看门狗电路设计3.6 CPLD 逻辑控制电路设计3.7 DSP 与存储器接口设计3.7.1 DSP 和FLASH 的接口设计3.7.2 数据存储3.8 本章小结第四章 声控系统的软件算法设计4.1 声控系统流程图4.2 预处理4.3 端点检测4.3.1 短时能量和短时幅度差4.3.2 短时过零率和短时过门限率4.3.3 双门限比较法4.4 MFCC 特征参数提取4.4.1 算法原理4.4.2 算法流程4.5 语音样本的训练4.5.1 语音库的建立4.5.2 HMM 模型的建立及训练过程4.6 语音识别4.7 BOOT LOADER 介绍4.8 本章小结第五章 声控系统应用程序设计及调试5.1 系统开发环境介绍5.2 程序设计5.3 程序调试结果与分析5.3.1 端点检测结果5.3.2 识别结果5.4 系统集成优化考虑5.5 本章小结第六章 结论与展望6.1 论文工作总结6.2 展望致谢参考文献附录一 作者在攻读硕士学位期间发表的论文附录二 部分源程序
相关论文文献
标签:语音识别论文; 双门限比较法论文; 隐马尔可夫模型论文; 数字信号处理器论文;