论文摘要
语音识别技术(SR)是利用计算机处理语音信号,并将语音信号转换成有意义符号序列的一项技术。以命令词识别、关键词识别和连续数字串识别为代表的中小词汇量语音识别技术,是语音识别实用化研究中相当重要的方向。论文设计一个基于嵌入式的非特定人关键词语音识别系统,该系统用于定位并识别人类对家电的控制语音中的关键词,为控制执行系统的操作提供依据,可以提高家居生活的自动化程度。论文的主要工作在于两个方面:第一,研究关键词语音识别系统的各个组成部分,提出并实现一个针对嵌入式应用的关键词识别系统的方案;第二,研究并实现基于DSP平台的关键词语音识别。论文针对嵌入式应用对连续的隐马尔可夫模型(CHMM)进行简化,提出采用候选模型策略来实现关键词识别,实验表明候选模型是一种有效的关键词识别方案,在候选模型个数为5时系统关键词检出率达到83.51%,总体识别性能良好。提出一种基于二次切分的连续语音端点检测算法,在对汉语音节的定位方面性能良好。建立一个用于训练、测试与自适应的语音库。研究了说话人自适应技术,使用特定人的样本对非特定人模型进行自适应调整,提高了系统对特定人的识别性能。研究DSP的接口技术,实现DSP通过麦克风采集语音并进行关键词识别。
论文目录
论文摘要Abstract第一章 引言1.1 语音识别概述1.2 语音识别的难点1.3 关键词识别1.3.1 定义1.3.2 应用领域1.3.3 国内外研究现状1.4 论文的由来及主要工作第二章 语音识别基本原理2.1 语音信号产生的数学模型2.2 预处理2.3 语音信号分析2.4 特征提取2.5 端点检测2.5.1 基于能量—过零率的孤立字端点检测2.5.2 基于二次切分的端点检测改进算法2.5.3 实验结果及分析第三章 基于HMM 的关键词语音识别系统3.1 HMM 的基本原理3.1.1 HMM 的模型参数3.1.2 HMM 的基本问题及解决3.1.3 HMM 的分类3.2 针对嵌入式应用的HMM 选型3.3 关键词识别系统3.3.1 基本组成3.3.2 基于垃圾模型的关键词识别网络3.4 说话人自适应技术的应用3.4.1 最大后验概率法(MAP)3.4.2 基于MAP 的模型参数重估第四章 关键词语音识别系统的DSP 实现4.1 TDS642EVM 板简介4.2 基于DSP 的系统实现方案4.2.1 多路音频串口(McASP)的初始化4.2.2 EDMA 通道初始化4.2.3 音频编解码器TLV320AIC234.2.4 TLV320AIC23 的与DM642 的接口通信4.2.5 基于片级支持库(CSL)的软件设计4.3 代码移植4.4 系统的识别速度测试4.4.1 实验条件4.4.2 实验结果统计及分析第五章 识别性能的实验结果及测试分析5.1 实验条件5.2 采用候选模型策略的关键词识别5.3 衡量识别性能的指标5.4 实验测试结果5.4.1 说话人自适应性能测试5.4.2 关键词识别性能测试5.5 测试结果分析5.5.1 说话人自适应的性能分析5.5.2 关键词识别的性能分析5.5 实验总结5.5.1 端点检测算法5.5.2 HMM 模型结构5.5.3 训练样本的数量5.5.4 训练与测试语音的差异5.5.5 语音的能量5.5.6 语法解码总结和展望参考文献硕士研究生期间发表的论文致谢附录
相关论文文献
标签:语音识别论文; 关键词识别论文;