基于音素的错误发音自动检测方法研究与应用

基于音素的错误发音自动检测方法研究与应用

论文摘要

语音识别技术经过多年的发展,现在开始逐渐走进不同的应用中。近年来,语言学习和口语发音检测的研究已经受到越来越多的关注,语音识别在计算机辅助语言学习中的应用成为一个重要的研究方向。特别是音频作为一种信息媒介,在人机交互过程中起到了重要的作用。本文提出一种利用语音识别技术,对母语为中文(L1)的英语(L2)学习者错误音素发音的自动检测系统。本文的方法通过预测语言学习者发音中可能导致错误发音的音素混淆规则来扩展标准发音词典,生成包含每个词的标准发音和可能错误发音变化的扩展发音词典,自动语音识别利用扩展发音词典来检测和诊断学习者的错误音素发音,并提供纠正反馈。音素混淆规则引用语言迁移的理论,我们通过系统的跨语言音系对比分析L1与L2之间在音素发音上的差异来生成,并采用数据驱动的方法:对学习者语音做自动音素识别,分析识别结果中所产生的错误发音与对应的标准发音之间的映射关系,来自动生成额外的音素混淆规则。在这种基于音素混淆规则的组合替换方法而生成的扩展发音词典中存在许多不合理的发音,为此,本文提出一种自动修剪的优化方法来提取其中合理而常见的错误发音。本文对21位英语学习者录音的实验结果说明,系统的检测结果在与专家标注文本的对比中,得到超过86%的一致率,经修剪后的扩展发音词典比完整的扩展发音词典能更好的检测错误音素发音。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 本文研究背景
  • 1.1.1 研究意义
  • 1.1.2 国内外研究现状及分析
  • 1.2 相关研究技术
  • 1.2.1 语言学发音分析
  • 1.2.2 语音识别
  • 1.2.3 发音检测评价方法
  • 1.3 本文的贡献
  • 1.4 本文的组织
  • 第二章 错误音素发音自动检测系统设计
  • 2.1 系统总体结构设计
  • 2.2 子模块分析
  • 2.2.1 音素混淆规则与扩展发音词典的生成
  • 2.2.2 语音识别系统设计
  • 2.2.3 发音检测方法与反馈设计
  • 2.3 本章小结
  • 第三章 扩展发音词典的生成
  • 3.1 跨语言音系对比方法
  • 3.1.1 元音与双元音
  • 3.1.2 辅音
  • 3.1.3 扩展发音词典
  • 3.2 数据驱动方法
  • 3.3 扩展发音词典的自动修剪方法
  • 3.4 本章小结
  • 第四章 基于语音识别的发音检测与反馈
  • 4.1 基于HMM的声学模型
  • 4.1.1 HMM模型
  • 4.1.2 构建声学模型
  • 4.2 发音检测与反馈
  • 4.2.1 发音混淆网络下的强制规整
  • 4.2.2 纠正反馈
  • 4.3 本章小结
  • 第五章 实验、评估方法及系统软件应用
  • 5.1 实验数据
  • 5.2 评估方法
  • 5.3 实验结果
  • 5.3.1 声学模型评估
  • 5.3.2 系统评估
  • 5.3.3 错误音素发音反馈
  • 5.4 应用软件开发实现
  • 5.5 本章小结
  • 第六章 结束语
  • 6.1 本文工作总结
  • 6.2 下一步研究方向
  • 致谢
  • 参考文献
  • 作者攻读硕士学位期间的研究成果
  • 附录
  • 相关论文文献

    • [1].从发音词典看英国语音的发展和演变[J]. 辞书研究 2011(01)
    • [2].基于WFST的俄语字音转换算法研究[J]. 中文信息学报 2018(02)
    • [3].单词自动注音方法的研究[J]. 清华大学学报(自然科学版) 2008(S1)
    • [4].基于TensorFlow的俄语词汇标音系统[J]. 计算机应用 2018(04)
    • [5].一种语料缺乏条件下的藏语音素自动切分方法[J]. 计算机工程与科学 2014(10)
    • [6].大规模词表连续语音识别引擎紧致动态网络的构建[J]. 清华大学学报(自然科学版) 2012(11)

    标签:;  ;  ;  ;  

    基于音素的错误发音自动检测方法研究与应用
    下载Doc文档

    猜你喜欢