论文摘要
语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux -2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。
论文目录
摘要ABSTRACT第一章 绪论1.1 语音识别系统概述1.1.1 语音识别系统技术发展历史1.1.2 语音识别系统技术研究现状1.1.3 语音识别系统技术应用前景1.2 本课题研究背景1.3 本课题研究内容1.4 本章小结第二章 语音识别系统技术2.1 语音学知识2.1.1 语音信号的产生2.1.2 语音信号的数学模型2.1.3 语音信号的处理2.2 语音识别基础2.2.1 语音识别概念2.2.2 语音识别原理2.3 语音识别模型2.3.1 动态时间规整(DTW)2.3.2 隐马尔可夫模型法(HMM)2.4 本章小结第三章 基于ARM 的语音识别系统硬件平台的研究3.1 硬件的组成3.1.1 嵌入式语音识别系统总体设计方案3.1.2 系统控制部分3.1.3 系统输入、输出部分3.1.4 系统的存储部分3.2 微处理器的选择3.2.1 ARM 处理器系列的选择3.2.2 Samsung S3C2410 处理器3.3 外围电路的设计3.3.1 Flash 存储3.3.2 SDRAM 芯片3.3.3 以太网控制器3.3.4 串行电路接口3.4 语音芯片的选择3.4.1 UDA1341 语音芯片3.4.2 IIS 音频数据接口3.4.3 S3C2410 与 UDA1341 的硬件连接3.5 本章小结第四章 基于ARM 的Linux 语音识别系统的定制研究4.1 交叉开发概念模型4.1.1 交叉编译工具链4.1.2 交叉编译工具链制作4.2 U-boot 分析及移植4.2.1 U-boot 简介4.2.2 U-boot 源代码修改4.2.3 U-boot 的编译4.3 嵌入式linux 向ARM 处理器的移植4.3.1 Linux 内核的特点与结构4.3.2 Linux2.6 内核代码的修改4.3.3 网卡驱动程序的实现4.3.4 内核的配置4.3.5 内核的编译4.4 根文件系统的制作与移植4.4.1 根文件系统的基本目录的介绍与制作4.4.2 Busybox 的配置与安装4.4.3 移植Tinylogin4.4.4 查看需要的动态库4.4.5 修改和创建必要的文件4.5 本章小结第五章 语音识别系统的实验研究5.1 音频驱动5.1.1 音频驱动的实现5.1.2 音频驱动的流程及部分程序分析5.2 工作原理5.3 语音程序编译进linux 文件系统5.4 嵌入式语音识别系统的实现5.4.1 网络服务器与minicom 的设置5.4.2 u-boot 的烧写5.4.3 linux 内核的下载5.4.4 文件系统的烧写5.4.5 语音识别的测试5.5 本章小结第六章 总结与展望6.1 论文总结6.2 工作展望参考文献发表论文和参加科研情况说明致谢
相关论文文献
标签:语音识别论文; 嵌入式系统论文;