基于HTK的维吾尔语连续语音识别研究

基于HTK的维吾尔语连续语音识别研究

论文摘要

语音识别将语音数据转换成文本序列,是人机语音交互的主要组成部分。语音识别技术从最初的孤立数字识别发展到现阶段的非特定人、大词汇量连续语音识别。维吾尔语属于阿尔泰语系突厥语族,是黏着性语言,同一词干利用丰富的词缀可产生超大词汇。维吾尔语发音时由若干音素拼接而成,在元音和谐、辅音结合等方面有自己独特的规律。本文结合维吾尔语自身特点,建立了包括64个发音人的维吾尔语连续语音语料库;研究了维吾尔语连续语音识别基元的选取。基于以上研究,本文选取三音子作为基本的识别单元,利用国际上流行的语音识别工具——隐马尔科夫模型工具(HTK)建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在词层上,本文使用了适合于维吾尔语语音特征的语言模型——基于统计的二元文法语言模型。最后,在DOS环境下,本文采用上下文相关的三音子声学模型结合基于统计的二元文法语言模型对测试集进行了大量的识别实验,句子的识别率达到了68.98%,词的识别率达到了94.65%。用VC2005对HTK工具进行二次开发,创建了维吾尔语连续语音识别系统,并进行了实时的语音识别实验,男生和女生句子的识别率分别达到了63.31%和65.67%,,词的识别率分别达到了90.25%和91.40%。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 语音识别的发展与现状
  • 1.1.1 语音识别的发展
  • 1.1.2 语音识别的现状
  • 1.2 语音识别的难点及今后的研究趋势
  • 1.3 本文选题的依据与研究意义
  • 1.4 本文的工作和内容的安排
  • 第二章 基于HMM 的连续语音识别技术
  • 2.1 语音信号处理
  • 2.1.1 端点检测技术
  • 2.1.2 语音特征参数提取
  • 2.2 语音声学模型
  • 2.2.1 隐马尔可夫模型(HMM)的思想及定义
  • 2.2.2 HMM 的三个基本问题
  • 2.3 语言模型
  • 2.3.1 基于规则的语言模型
  • 2.3.2 基于统计的语言模型
  • 2.4 语音识别器
  • 第三章 基于HTK 的维吾尔语连续语音识别研究
  • 3.1 隐马尔可夫模型工具(HTK)
  • 3.2 维吾尔语语音语料库的建立
  • 3.2.1 文本语料库的收集
  • 3.2.2 文本语料的选择
  • 3.2.3 语音语料库的建立
  • 3.3 维吾尔语声学模型的建立
  • 3.3.1 维吾尔语语音特点
  • 3.3.2 维吾尔语语音识别基元的选择
  • 3.3.3 语音模型参数共享
  • 3.3.4 增加混合分量优化声学模型
  • 3.4 维吾尔语语言模型的建立
  • 3.4.1 基于规则的语言模型
  • 3.4.2 基于统计的语言模型
  • 3.4.3 词典的建立
  • 3.4.4 识别
  • 3.5 维吾尔语连续语音识别实验
  • 3.5.1 实验环境
  • 3.5.2 识别结果的评价标准
  • 3.5.3 声学层语音识别实验
  • 3.5.4 基于统计语言模型的实验
  • 3.5.5 更换测试集的实验
  • 第四章 维吾尔语连续语音识别系统的实现
  • 4.1 应用系统的基本结构
  • 4.2 应用程序的实现
  • 4.2.1 多线程机制与重输出
  • 4.2.2 拉丁转写
  • 4.3 实时识别
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 工作展望
  • 参考文献
  • 致谢
  • 硕士期间发表的论文
  • 相关论文文献

    • [1].基于HTK的嵌入式猪只声音识别系统设计[J]. 电脑知识与技术 2017(04)
    • [2].基于HTK的日语连续语音识别系统的建立与研究[J]. 计算机光盘软件与应用 2013(21)
    • [3].基于HTK的维吾尔语连续音素识别技术研究[J]. 计算机工程与应用 2013(22)
    • [4].基于HTK的藏语拉萨话大词表连续语音识别的研究与实现[J]. 西北民族大学学报(自然科学版) 2011(03)
    • [5].基于HTK的连接数字语音识别的研究[J]. 山西电子技术 2016(05)
    • [6].基于HTK的汉语语音售票系统的设计与实现[J]. 工业控制计算机 2010(10)
    • [7].基于HTK连续语音识别系统的研究[J]. 计算机光盘软件与应用 2012(15)
    • [8].HTK液与冷血停搏液在心脏瓣膜手术中应用对比:倾向得分匹配分析[J]. 现代生物医学进展 2020(16)
    • [9].基于HTK的语音识别系统设计及实现[J]. 电脑编程技巧与维护 2015(23)
    • [10].HTK液与含血心脏停搏液对复杂冠状动脉病变合并左心功能不全心肌保护作用的病例对照研究[J]. 中国胸心血管外科临床杂志 2016(10)
    • [11].基于HTK的维吾尔语连续语音声学建模[J]. 中文信息学报 2008(05)
    • [12].重症心脏瓣膜病术中应用HTK液进行心肌保护的临床研究[J]. 中国医学创新 2015(04)
    • [13].基于HTK的日语连续语音识别系统的建立与研究[J]. 计算机光盘软件与应用 2013(16)
    • [14].基于HTK的连续语音识别网站系统的研究和实现[J]. 微型电脑应用 2010(07)
    • [15].战斗部与HTK允许脱靶量的仿真分析[J]. 系统仿真学报 2008(01)
    • [16].关于HTK型红外线轴温探测系统探测角度的论述[J]. 哈尔滨铁道科技 2009(01)
    • [17].基于HTK的普米语孤立词的语音识别[J]. 云南民族大学学报(自然科学版) 2015(05)
    • [18].HTK液在重症心脏瓣膜病心内直视手术中的应用[J]. 华夏医学 2014(06)
    • [19].基于HTK的语音识别的并行化研究与实现[J]. 计算机应用 2009(04)
    • [20].HTK液的的成分详析及前景展望[J]. 吉林医学 2009(01)
    • [21].肺动脉灌注HTK液在法乐氏四联症矫治术中的肺保护作用[J]. 心脏杂志 2011(03)
    • [22].基于HTK的连续语音识别系统及其在TIMIT上的实验[J]. 现代计算机(专业版) 2009(11)
    • [23].基于HTK的佤语特定人孤立词语音识别[J]. 云南民族大学学报(自然科学版) 2017(05)
    • [24].HTK液与含血停搏液用于瓣膜置换联合房颤射频消融治疗患者术中心肌保护的研究[J]. 中国体外循环杂志 2013(04)
    • [25].基于HTK的宁夏银川方言普通话语音识别系统[J]. 农业网络信息 2017(07)
    • [26].HTK反导拦截弹瞄准点的一种优化选取方法[J]. 火力与指挥控制 2012(08)
    • [27].HTK液与含血停搏液在大血管手术中心肌保护效果比较[J]. 中国现代医药杂志 2015(07)
    • [28].HTK液对危重症心脏瓣膜病患者瓣膜置换术中的心肌保护作用[J]. 贵州医药 2015(10)
    • [29].HTK参数对普米语孤立词识别率的影响[J]. 云南民族大学学报(自然科学版) 2015(06)
    • [30].生理盐水替代HTK保存液保存活体供肾的临床研究[J]. 器官移植 2011(05)

    标签:;  ;  ;  ;  ;  

    基于HTK的维吾尔语连续语音识别研究
    下载Doc文档

    猜你喜欢