论文摘要
据有关资料统计,当今世界上共有5651种语言。语种之间的信息互通越来越重要,如何让计算机识别出不同的语种已经成为人们的迫切需求。语种识别(Language Identification, LID),是计算机通过分析处理一段语音片断以判别其属于何种语言的过程,本质上也是属于语音识别的一个分支。它已经广泛的应用于信息检索和军事安全等领域。当前语种识别系统主要有三个方面:音位结构模型系统、声学模型系统以及联合系统。其中声学模型系统由于不需要人工标注语料,而且系统扩展性好,所以得到了广泛的应用。本文研究与文本无关的少数民族语种识别方法,采用高斯混合模型—通用背景模型(Gaussian Mixture Model-Universal Background Mode, GMM-UBM)建立语种识别系统,探索提高识别率的途径。论文的主要工作有:(1)少数民族电话语音数据库的录制,该数据库包含了9个少数民族语和汉语普通话共10个语种,每个语种有50个发音人,男女比例约为1:1,并进行语音数据的整理。(2)构建一个基于GMM-UBM的少数民族语种识别系统,设计并实现语种识别实验:用双门限的方法进行语音检测;提取MFCC和SDC特征参数;训练UBM模型和GMM模型。(3)用6个民族的不同时长的测试语音和汉语借词进行测试。按四种测试语料分别给出各个语种的识别率,对比两种特征的识别率,从语音学的角度分析各语种之间误识别的原因,还分析了汉语借词对少数民族语种识别率的影响。实验结果表明,论文设计的基于GMM-UBM的语种识别系统具有较好的扩展性;双门限的方法进行语音检测,能有效地去除噪音,提取到有用的语音帧;基于SDC特征参数的少数民族语种识别率明显高于基于MFCC特征参数的识别率;6个语种之间存在有规律的误识别;对汉语借词的识别,实验结果表明汉语借词会使少数民族语种识别率明显下降。
论文目录
相关论文文献
- [1].语种识别中基于局部多样性建模的向量空间模型[J]. 清华大学学报(自然科学版) 2011(02)
- [2].基于信息融合的语种识别研究[J]. 科技传播 2009(Z1)
- [3].基于TMS320C6678的语种识别并行算法设计与实现[J]. 电子技术应用 2012(10)
- [4].语种辨识的多特征信息应用[J]. 计算机工程与应用 2010(25)
- [5].基于支持向量机的语种识别[J]. 信息技术 2010(06)
- [6].采用DBN的TV改进方法在语种识别中的应用[J]. 信号处理 2015(09)
- [7].一种改进的PRSVM语种识别方法[J]. 小型微型计算机系统 2011(05)
- [8].基于LPCC的多语种识别算法[J]. 无线电工程 2009(09)
- [9].CRI语种识别训练数据的采集设计与应用[J]. 广播电视信息 2019(04)
- [10].语种识别算法中GSV计算的定点仿真与实现[J]. 计算机工程与设计 2012(02)
- [11].基于高斯滤波器及费舍尔准则的特征提取方法[J]. 电路与系统学报 2013(02)
- [12].高斯超向量-支持向量机鉴别性语种识别系统[J]. 计算机工程与应用 2013(02)
- [13].一种结合支持向量机训练的锚模型语种识别方法[J]. 小型微型计算机系统 2013(04)
- [14].结合模型混淆度和BIC准则的语种识别精细建模方法[J]. 数据采集与处理 2011(05)
- [15].基于n-gram频率的语种识别改进方法[J]. 自动化学报 2018(03)
- [16].MLLR特征的SVM语种识别算法[J]. 清华大学学报(自然科学版) 2009(S1)
- [17].语种识别中的几种特征参数[J]. 电子世界 2015(20)
- [18].基于CUDA的GMM模型快速训练方法[J]. 数据采集与处理 2012(01)
- [19].区分性锚模型应用于语种识别的研究[J]. 计算机工程 2012(03)
- [20].一种基于模式发现的语种识别方法[J]. 信息工程大学学报 2018(01)
- [21].基于Langid的语种识别研究[J]. 中国新技术新产品 2018(16)
- [22].基于无监督迁移分量分析的语种识别[J]. 清华大学学报(自然科学版) 2013(06)
- [23].基于音素解码的语种识别系统联合自适应算法研究[J]. 自动化学报 2012(04)
- [24].基于小波分析及KNN的民族文字分类方法[J]. 微电子学与计算机 2010(02)
- [25].基于媒体计算的网络教学平台中图像智能查重与信息提取研究[J]. 软件导刊(教育技术) 2016(11)
- [26].一种层次化空间分析方法在语种识别系统中的应用[J]. 计算机应用研究 2012(10)
- [27].智能音频检索技术在侦收系统中的应用研究[J]. 通信技术 2016(10)
- [28].基于流形正则化极限学习机的语种识别系统[J]. 自动化学报 2015(09)
- [29].基于CV音节的高效语种识别方法[J]. 微电子学与计算机 2015(10)
- [30].网络维吾尔文判别及其文本长度下界的探讨[J]. 中文信息学报 2012(06)