论文摘要
语言是人类传递信息的主要手段,将语音作为人与机器交流的媒介,与传统的手动操作实现人机交互相比,具有简便、快捷、灵活的优点。语音识别技术作为语音信号处理的一个重要组成部分,以语音为研究对象,融合了多门基础学科的知识,使真正意义上的人机对话成为现实。随着语音技术的发展和智能系统的普及,语音识别与控制逐步走向实用化并拥有广阔的应用前景。尽管语音识别技术取得了可喜的成就,但是在实际应用中仍存在诸多问题有待解决。本文针对语音识别技术在特定人、孤立词、小词汇量方面的应用展开科研工作,设计了基于定点DSP的嵌入式语音控制系统。(1)研究和分析了语音识别前端处理部分各个环节的原理,给出了预加重、汉明窗处理、谱熵端点检测和盲信号分离的仿真结果。(2)研究了基于人耳听觉特性的美尔频率倒谱系数的提取方法及改进技术;通过分析倒谱系数各阶分量对识别率的贡献,提出采用以美尔频率倒谱系数为基础的26维优化参数作为语音的特征参数,并通过仿真实验检验了优化参数的抗噪性能。(3)通过比较分析,选取动态时间规整算法作为系统的识别算法,并给出语音模板库的鲁棒性训练方法;从提高系统的识别率和识别速度着手,研究了动态时间规整算法的改进技术,提出了模板阈值的计算公式,并通过仿真实验评估了各项改进技术的效果。(4)根据系统的技术指标和功能要求,分别给出了系统硬件设计和软件实现的方案与细节,最后在DSP评估板上对整个系统的性能进行了验证。PC上的仿真结果和DSP评估板的工作情况均证明了课题所设计的语音控制系统具有可行性和有效性,达到了预期的设计目标。该系统可以方便地与不同执行机构接口,从而实现不同的功能,具有较好的实用价值。
论文目录
摘要Abstract第1章 绪论1.1 语音识别综述1.1.1 引言1.1.2 语音识别的发展过程及其国内外现状1.1.3 语音识别的分类1.2 课题的选题背景与意义1.3 课题的总体设计思路和作者承担的工作1.3.1 课题的总体设计思路1.3.2 作者承担的主要工作1.4 本文的结构安排第2章 语音信号分析与前端处理2.1 语音信号的声学原理2.1.1 语音信号的声学分析2.1.2 语音信号的短时特性2.2 语音信号预处理2.2.1 抗混叠滤波2.2.2 语音信号的模数变换2.2.3 预加重处理2.2.4 分帧与加窗处理2.3 语音端点检测2.3.1 语音端点的分析方法2.3.2 谱减与谱熵2.3.3 端点检测的实现2.3.4 端点检测算法的仿真2.4 盲源分离技术2.4.1 盲信号的白化预处理2.4.2 利用峭度的盲源分离算法2.4.3 盲信号分离算法的仿真第3章 美尔频率倒谱系数及其提取算法3.1 人耳的生理特性3.2 基于人耳听觉特性的美尔频率倒谱系数3.2.1 美尔频率及其临界频带3.2.2 MFCC 特征参数的提取3.3 MFCC 各阶系数的评价3.3.1 基于F 比的评价方法3.3.2 基于增减分量的评价方法3.4 特征参数的进一步优化3.5 特征参数的实验研究第4章 孤立词语音识别算法4.1 语音识别算法简介4.2 孤立词语音识别技术4.2.1 相似性度量4.2.2 动态时间规整算法4.2.3 DTW 算法改进技术4.2.4 参考模板的训练方法4.3 DTW 算法的实验研究第5章 语音控制系统的硬件设计与软件实现5.1 语音控制系统硬件设计5.1.1 芯片介绍5.1.2 数字电路抗干扰技术5.1.3 硬件电路设计与功能描述5.2 语音控制系统软件实现5.2.1 算法的软件实现5.2.2 DSP 软件开发工具5.2.3 DSP 程序加载5.3 系统整体测试实验结论与展望1. 本文主要研究成果2. 本文研究工作展望参考文献附录A 攻读学位期间所发表的学术论文目录附录B 攻读学位期间参加的科研项目附录C 部分程序源代码致谢
相关论文文献
标签:语音控制论文; 前端处理论文; 美尔频率倒谱系数论文; 动态时间规整论文; 数字信号处理器论文;