汉语普通话声调识别和评估系统的设计与实现

汉语普通话声调识别和评估系统的设计与实现

论文摘要

声调——汉语普通话最重要的信息,随着汉语语音识别技术的进一步发展,声调识别研究成为汉语语音识别技术突破的主要方向。而体现声调的最主要的特征就是声调的基频FO,有效的利用声调信息,必须对基频FO进行准确的提取与分析。为此,本文主要从基频提取以及基频后处理、声调识别建模、声调评估三方面对汉语普通话声调识别和评估系统进行了设计。首先,本文从声调特征基频FO的提取着手,采用短时自相关法进行汉语声调基频提取,由于基频提取中不可避免的会出现错误点,对提取后的基频进行后处理是必要的。基于此,本文采用了插值平滑和重采样处理获得用于识别模型的标准基频信息,并且改进了一种归一化方法(m LD算法),以便将其更好地应用于非特定人识别。依据语料样本库,给出了算法的实验结果并验证了算法的有效性。然后,在提取基频信息的基础上,论文详细地分析了基频信息的特点以及其总体分布情况,得出其总体分布满足亚高斯性的结论。这为声调识别模型的建立提供了很好的理论基础。在这种理论基础的支持下,建立了声调识别模型——GMM模型,并将模型在标准语音库863语料样本下进行了实验分析,给出了分析结果。接下来,基于GMM模型的声调识别结果,论文建立了汉语声调评估模型——基于GMM的后验概率评估模型,并给出了几种不同的打分方法。这种评估模型的建立,很好地融合了声调基频特征和声调识别结果。并就此应用了用于衡量汉语声调评估优劣的两个指标:相关系数和分级错误率进行评判。结合100位大学生语音语料和9位语言专家的打分情况,给出了对应指标下的结果。对结果分析得出如下结论:本文采用的基频提取算法、后处理算法、声调识别模型和声调评估模型在应用到汉语普通话声调评估系统中能取得较好的效果,为汉语普通话考核的推广和普及奠定了重要基础。最后,对本文的主要工作提出了不足之处,并对其进行了总结和展望。

论文目录

  • 摘要
  • ABSTRACT
  • 英文术语简写
  • 一 概述
  • 1.1 引言
  • 1.2 语音识别研究的发展历程
  • 1.3 当前语音识别领域所面临的主要问题
  • 1.4 汉语声调研究简介
  • 1.4.1 声调听觉征兆的研究
  • 1.4.2 声调模型的研究
  • 1.5 论文的研究意义和目标
  • 1.6 本文的研究思路、主要工作和章节安排
  • 二 基频提取及后处理算法
  • 2.1 前言
  • 2.2 基频提取算法原理
  • 2.2.1 语音信号预处理
  • 2.2.2 自相关法提取基频
  • 2.2.3 插值平滑
  • 2.2.4 重采样处理
  • 2.2.5 重采样维数的确定
  • 2.3 算法性能测试
  • 2.3.1 数据库
  • 2.3.2 归一化处理
  • 2.3.2.1 归一化的引入
  • 2.3.2.2 归一化的主要方法
  • 2.3.2.3 归一化实验数据对比
  • 2.3.2.4 m-LD归一化算法
  • 2.3.3 性能测试
  • 三 声调识别模型
  • 3.1 前言
  • 3.2 声调模式
  • 3.3 基于GMM的声调识别模型
  • 3.3.1 基频的分布特性
  • 3.3.2 GMM模型描述
  • 3.3.3 GMM模型参数训练算法
  • 3.3.3.1 K-Means算法
  • 3.3.3.2 EM算法
  • 3.3.4 GMM识别算法
  • 3.3.5 实验结果分析
  • 四 声调的测试与评估模型
  • 4.1 前言
  • 4.2 CALL系统简介
  • 4.3 评估系统的主要思想
  • 4.4 评估模型的建立
  • 4.5 模型的求解
  • 4.5.1 混合数的选择
  • 4.5.2 衡量机器打分准确程度的指标
  • 4.5.2.1 相关系数
  • 4.5.2.2 分级错误率
  • 4.5.3 自动评分流程
  • 4.5.4 评估依据
  • 4.6 实验结果
  • 五 结论与展望
  • 5.1 结论
  • 5.2 不足与展望
  • 参考文献
  • 在学期间参加的主要项目和发表的论文
  • 1 学校期间参加的主要项目
  • 2 学校期间发表的论文
  • 致谢
  • 附录
  • 附录1 9位专家对100位学生的汉语声调打分结果(满分6分)
  • 附录2 9专家平均打分和机器打分结果(归一化数据)
  • 相关论文文献

    • [1].基于K均值混合高斯模型的声调识别系统性能研究[J]. 自动化与仪器仪表 2017(02)
    • [2].感音神经性听力损失患者的频率调制辨别和声调识别[J]. 中国听力语言康复科学杂志 2018(02)
    • [3].时域信息对健听青年在人工耳蜗模拟声下声调识别的影响[J]. 听力学及言语疾病杂志 2018(01)
    • [4].3~6岁人工耳蜗植入儿童声调识别能力与语音清晰度的相关性研究[J]. 中国听力语言康复科学杂志 2018(02)
    • [5].蚁群聚类神经网络的耳语音声调识别[J]. 应用科学学报 2008(05)
    • [6].影响人工耳蜗植入者声调识别的因素[J]. 听力学及言语疾病杂志 2010(05)
    • [7].采用过零刺激方案提高电子耳蜗声调识别[J]. 计算机工程与应用 2014(19)
    • [8].基于支持向量机的汉语声调识别[J]. 电子世界 2013(04)
    • [9].基于多空间概率分布的汉语连续语音声调识别研究[J]. 计算机科学 2011(09)
    • [10].用于汉语单音节声调识别的基频轨迹拟合方法[J]. 计算机工程与应用 2008(29)
    • [11].采用Cool Edit Pro 2.0软件分析汉语普通话单音节词四声的时域及频域[J]. 中国组织工程研究与临床康复 2008(35)
    • [12].滤除低频音对听力正常人声调识别的影响[J]. 听力学及言语疾病杂志 2008(06)
    • [13].诺尔康人工耳蜗植入者的声调识别与生活质量评价[J]. 临床耳鼻咽喉头颈外科杂志 2014(04)
    • [14].时频分析在汉语声调识别中的应用[J]. 信息与电脑(理论版) 2014(18)
    • [15].基于仿生模式识别理论的声调识别[J]. 计算机应用 2010(10)
    • [16].双耳双模式助听患者汉语普通话声调识别特征[J]. 听力学及言语疾病杂志 2017(02)
    • [17].基于SPWD时频脊特征提取的汉语声调识别[J]. 计算机应用与软件 2014(03)
    • [18].计算机辅助语言学习中基于K-GMM模型的一种汉语声调识别技术及其应用研究[J]. 电化教育研究 2012(12)
    • [19].基于SVM的非特定人声调识别的研究[J]. 计算机工程与应用 2009(09)
    • [20].汉语儿童声调测试材料回顾及开发要素分析[J]. 中华耳科学杂志 2015(04)
    • [21].人工耳蜗植入者使用音调信息识别声调能力的评价[J]. 临床耳鼻咽喉头颈外科杂志 2014(19)
    • [22].声谱图在汉语普通话声调识别中的应用[J]. 信息通信 2017(07)
    • [23].计算机辅助语言学习系统中汉语声调评测模型的性能研究[J]. 自动化与仪器仪表 2015(04)
    • [24].人工耳蜗植入儿童声韵调识别能力评估标准的修订[J]. 中国康复理论与实践 2013(11)
    • [25].共振峰信息在汉语声调感知中的作用[J]. 中国耳鼻咽喉头颈外科 2012(01)
    • [26].听力正常人噪声下汉语普通话声调识别成绩-强度函数的研究[J]. 中国耳鼻咽喉头颈外科 2016(01)
    • [27].基于三音子模型连续语音声调识别方法[J]. 电声技术 2011(08)
    • [28].人工耳蜗植入者声调识别及音乐感知的研究现状[J]. 中国听力语言康复科学杂志 2008(01)
    • [29].基于改进神经网络的三字词声调识别方法[J]. 电声技术 2010(05)
    • [30].人工神经网络对儿童汉语发声声调的识别[J]. 首都医科大学学报 2011(06)

    标签:;  ;  ;  ;  ;  ;  

    汉语普通话声调识别和评估系统的设计与实现
    下载Doc文档

    猜你喜欢