基于电话语音的少数民族语种识别研究

基于电话语音的少数民族语种识别研究

论文摘要

据有关资料统计,当今世界上共有5651种语言。语种之间的信息互通越来越重要,如何让计算机识别出不同的语种已经成为人们的迫切需求。语种识别(Language Identification, LID),是计算机通过分析处理一段语音片断以判别其属于何种语言的过程,本质上也是属于语音识别的一个分支。它已经广泛的应用于信息检索和军事安全等领域。当前语种识别系统主要有三个方面:音位结构模型系统、声学模型系统以及联合系统。其中声学模型系统由于不需要人工标注语料,而且系统扩展性好,所以得到了广泛的应用。本文研究与文本无关的少数民族语种识别方法,采用高斯混合模型—通用背景模型(Gaussian Mixture Model-Universal Background Mode, GMM-UBM)建立语种识别系统,探索提高识别率的途径。论文的主要工作有:(1)少数民族电话语音数据库的录制,该数据库包含了9个少数民族语和汉语普通话共10个语种,每个语种有50个发音人,男女比例约为1:1,并进行语音数据的整理。(2)构建一个基于GMM-UBM的少数民族语种识别系统,设计并实现语种识别实验:用双门限的方法进行语音检测;提取MFCC和SDC特征参数;训练UBM模型和GMM模型。(3)用6个民族的不同时长的测试语音和汉语借词进行测试。按四种测试语料分别给出各个语种的识别率,对比两种特征的识别率,从语音学的角度分析各语种之间误识别的原因,还分析了汉语借词对少数民族语种识别率的影响。实验结果表明,论文设计的基于GMM-UBM的语种识别系统具有较好的扩展性;双门限的方法进行语音检测,能有效地去除噪音,提取到有用的语音帧;基于SDC特征参数的少数民族语种识别率明显高于基于MFCC特征参数的识别率;6个语种之间存在有规律的误识别;对汉语借词的识别,实验结果表明汉语借词会使少数民族语种识别率明显下降。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 语种识别概述
  • 1.2.1 语种识别的原理
  • 1.2.2 语种识别研究的历史
  • 1.2.3 语种识别的主要方法
  • 1.2.4 语种识别系统评估与数据库
  • 1.3 论文的研究思路和作者的工作
  • 1.3.1 研究思路
  • 1.3.2 作者的工作
  • 1.4 论文的组织
  • 第二章 电话语音库的录制
  • 2.1 引言
  • 2.2 语音数据库的设计
  • 2.2.1 发音人
  • 2.2.2 录音内容
  • 2.3 录音软件的开发
  • 2.4 录音和数据整理
  • 2.5 本章小结
  • 第三章 基于GMM-UBM的语种识别
  • 3.1 引言
  • 3.2 语音信号预处理
  • 3.3 MFCC特征参数
  • 3.4 SDC特征参数
  • 3.5 高斯混合模型
  • 3.5.1 GMM模型的基本概念
  • 3.5.2 GMM模型的训练
  • 3.5.3 基于GMM模型的语种识别
  • 3.6 GMM-UBM模型
  • 3.6.1 MAP自适应算法
  • 3.6.2 对数似然比的计算
  • 3.6.3 后端得分处理
  • 3.7 本章小结
  • 第四章 实验结果与分析
  • 4.1 引言
  • 4.2 实验数据库
  • 4.3 实验方案
  • 4.4 实验结果与讨论
  • 4.5 本章小结
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 致谢
  • 在读研究生期间参加项目和发表论文情况
  • 相关论文文献

    • [1].语种识别中基于局部多样性建模的向量空间模型[J]. 清华大学学报(自然科学版) 2011(02)
    • [2].基于信息融合的语种识别研究[J]. 科技传播 2009(Z1)
    • [3].基于TMS320C6678的语种识别并行算法设计与实现[J]. 电子技术应用 2012(10)
    • [4].语种辨识的多特征信息应用[J]. 计算机工程与应用 2010(25)
    • [5].基于支持向量机的语种识别[J]. 信息技术 2010(06)
    • [6].采用DBN的TV改进方法在语种识别中的应用[J]. 信号处理 2015(09)
    • [7].一种改进的PRSVM语种识别方法[J]. 小型微型计算机系统 2011(05)
    • [8].基于LPCC的多语种识别算法[J]. 无线电工程 2009(09)
    • [9].CRI语种识别训练数据的采集设计与应用[J]. 广播电视信息 2019(04)
    • [10].语种识别算法中GSV计算的定点仿真与实现[J]. 计算机工程与设计 2012(02)
    • [11].基于高斯滤波器及费舍尔准则的特征提取方法[J]. 电路与系统学报 2013(02)
    • [12].高斯超向量-支持向量机鉴别性语种识别系统[J]. 计算机工程与应用 2013(02)
    • [13].一种结合支持向量机训练的锚模型语种识别方法[J]. 小型微型计算机系统 2013(04)
    • [14].结合模型混淆度和BIC准则的语种识别精细建模方法[J]. 数据采集与处理 2011(05)
    • [15].基于n-gram频率的语种识别改进方法[J]. 自动化学报 2018(03)
    • [16].MLLR特征的SVM语种识别算法[J]. 清华大学学报(自然科学版) 2009(S1)
    • [17].语种识别中的几种特征参数[J]. 电子世界 2015(20)
    • [18].基于CUDA的GMM模型快速训练方法[J]. 数据采集与处理 2012(01)
    • [19].区分性锚模型应用于语种识别的研究[J]. 计算机工程 2012(03)
    • [20].一种基于模式发现的语种识别方法[J]. 信息工程大学学报 2018(01)
    • [21].基于Langid的语种识别研究[J]. 中国新技术新产品 2018(16)
    • [22].基于无监督迁移分量分析的语种识别[J]. 清华大学学报(自然科学版) 2013(06)
    • [23].基于音素解码的语种识别系统联合自适应算法研究[J]. 自动化学报 2012(04)
    • [24].基于小波分析及KNN的民族文字分类方法[J]. 微电子学与计算机 2010(02)
    • [25].基于媒体计算的网络教学平台中图像智能查重与信息提取研究[J]. 软件导刊(教育技术) 2016(11)
    • [26].一种层次化空间分析方法在语种识别系统中的应用[J]. 计算机应用研究 2012(10)
    • [27].智能音频检索技术在侦收系统中的应用研究[J]. 通信技术 2016(10)
    • [28].基于流形正则化极限学习机的语种识别系统[J]. 自动化学报 2015(09)
    • [29].基于CV音节的高效语种识别方法[J]. 微电子学与计算机 2015(10)
    • [30].网络维吾尔文判别及其文本长度下界的探讨[J]. 中文信息学报 2012(06)

    标签:;  ;  ;  ;  

    基于电话语音的少数民族语种识别研究
    下载Doc文档

    猜你喜欢