自动语言辨识论文-王洪海,刘刚,郭军

自动语言辨识论文-王洪海,刘刚,郭军

导读:本文包含了自动语言辨识论文开题报告文献综述及选题提纲参考文献,主要关键词:自动语言辨识,滑动倒谱,滑动差分倒谱,高斯混合模型

自动语言辨识论文文献综述

王洪海,刘刚,郭军[1](2008)在《基于滑动倒谱的自动语言辨识》一文中研究指出滑动差分倒谱在自动语言辨识的研究中获得了广泛的应用.但是滑动差分倒谱并没有利用语音信号的静态倒谱信息,在方言辨识中的研究表明静态倒谱比差分倒谱含有更多的特征信息.为此,提出了滑动倒谱(SC)的概念,并与滑动差分倒谱特征矢量进行了对比研究.首先利用开发集的语音考察了滑动差分倒谱和滑动倒谱的控制参数在不同取值的情况下对识别性能的影响,利用爬山法确定了这2类特征矢量达到局部最优控制参数组合的路径,然后利用测试集的数据对优化后的2类特征矢量建立的模型进行了闭集辨识和开集辨识.2种情况下的测试结果都表明滑动倒谱的性能优于滑动差分倒谱.并且这2种参数还具有特征互补性,将它们进行决策级数据融合可以进一步提高系统的性能.(本文来源于《智能系统学报》期刊2008年04期)

张文林,屈丹,李弼程,王波,王炳锡[2](2008)在《一种基于段级特征和自动标识的语言辨识算法》一文中研究指出本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果。相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果。(本文来源于《信号处理》期刊2008年04期)

杨焕峥[3](2007)在《汉语方言自动辨识系统中的语言建模》一文中研究指出研究了在汉语方言辨识系统中如何建立合适的语言模型用以提高系统的辨识率。采用了基于统计的语言建模方法,首先把各方言的语音材料转写成音素序列,然后让机器统计方言音素的组配规则,建立各方言的语言模型。结果表明,加入语言模型的辨识系统比仅仅依靠声学模型进行辨识的系统,辨识效果要好得多。(本文来源于《宁波职业技术学院学报》期刊2007年05期)

王洪海,刘刚,郭军[4](2007)在《自动语言辨识的研究方法及发展概述》一文中研究指出根据自动语言辨识研究中所采用的识别信息的不同,文章将研究中使用的方法归类为基于声学特征的方法、基于韵律特征的方法、基于音素识别的方法和基于高层语言信息的方法。通过对这些方法进行分类介绍并结合NIST的评测结果分析,阐述了近十几年来自动语言辨识研究的发展情况,最后对进一步研究中存在的问题和发展趋势进行了分析。(本文来源于《电脑与信息技术》期刊2007年02期)

王洪海[5](2007)在《基于声学特征的自动语言辨识研究》一文中研究指出本文主要利用各种声学特征参数基于GMM建模的方法开展了自动语言辨识的研究,主要的研究工作包括:1.六语种语音语料库的建立:利用已有的汉语语料库和从网络上采集的英、德、日、法、西班牙等五语言的语音建立了多语种语料库。语料库的训练集中有264个说话人、每人60~300秒的语音,测试集中每个语种有30~50个训练集外的说话人,每个人有至少50个平均时长为4.5秒的语音片段。2.自动语言辨识系统的初步实验研究:建立了基于GMM的六语种识别系统,研究了系统识别率和GMM的混合分量数目与训练数据的多少的关系,以及RASTA滤波和CMS处理对MFCC参数性能的影响。3.提出了一种新的二次弯折函数,研究了基于基音频率均值的说话人归一化技术在自动语言辨识系统中的应用。利用对比实验来比较二次弯折函数与常规的线性弯折函数和分段线性弯折函数的性能。4.提出了滑动倒谱的概念,并将两种常用特征参数RASTA-MFCC和RASTA-PLP的滑动倒谱与当前研究中广泛采用的滑动差分倒谱进行了对比研究。然后进一步考察了RASTA-PLP滑动倒谱的控制参数在不同的取值情况下对识别性能的影响,利用爬山法确定了达到局部最优控制参数组合的路径。最后研究了RASTA-PLP的滑动倒谱与其它参数的特征级和决策级数据融合。(本文来源于《北京邮电大学》期刊2007-04-02)

王洪海,刘刚,郭军[6](2007)在《关于网络语音的自动语言辨识系统研究》一文中研究指出文章对从网络上采集的英语、德语、日语、法语、西班牙语等5个语种的语音和现有的汉语语音进行了自动语言辨识的研究,利用RASTA-PLP特征参数和贪婪期望最大算法为每个语种建立了高斯混合模型,并用多个说话人的语音进行了开集测试,讨论了网络语音和非网络语音对识别结果的影响,以及识别率与训练数据和GMM模型阶数的关系。实验结果表明,经过改进的基于声学特征的方法可以有效地应用到网络语音的自动语言辨识系统中。(本文来源于《电脑与信息技术》期刊2007年01期)

戴冠男,王炳锡,屈丹[7](2006)在《基于C_nV结构的自动语言辨识研究》一文中研究指出与说话人识别、连续语音识别相比,自动语言辨识是一个相对较新的研究,而且是一项较难的课题。与音素配位学相比较韵律是语言辨识的更有希望的一个语言辨识特征。论文介绍了一种基于伪音节结构CnV的自动语言辨识方法,该系统提取了辅音、元音构成的伪音节结构的MFCC和!MFCC特征参数,使用了与语言无关的GMM算法模型化该特征。经过对OGI-TS数据库中的英语、法语、汉语测试表明,元音、辅音特征信息在语言辨识中起到一定作用,伪音节结构模型也是语言辨识的有效模型之一。(本文来源于《计算机工程与应用》期刊2006年23期)

沈兆勇,顾明亮[8](2006)在《基于符号化和语言模型方法的汉语方言自动辨识》一文中研究指出在借鉴和改进了一种新的语种辨识方法———基于高斯混合模型(GMM)符号化和语言模型方法———的基础上,建立了一个汉语方言自动辨识系统.实验使用了一个多说话人、非特定文本、连续语音汉语方言语音库进行系统测试.在3种主要汉语方言的辨识中,15 s语料测试平均辨识率达到了90.7%.(本文来源于《徐州师范大学学报(自然科学版)》期刊2006年02期)

戴冠男,王炳锡,屈丹[9](2006)在《基于音素发生率的自动语言辨识》一文中研究指出不同语言的语音基元的种类和数量存在着差异,即使两种语言有相同的音素,它们的发生频率也存在差异。以前基于音素标识的语言辨识系统,难以引入新的语言。本文分别使用了GMM和VQ模型对音素符号发生率信息在语言辨识中的作用进行了研究,使用了音素符号发生率方法以及叁种改进方法,各项实验结果表明音素符号发生率信息在语言辨识中具有一定的作用,可以作为语言辨识方法研究的一个方向。(本文来源于《信号处理》期刊2006年02期)

张强[10](2005)在《电话信道中的自动语言辨识技术研究》一文中研究指出自动语言辨识技术是建立在语音学、语言学、数字信号处理和模式识别等学科的基础之上,利用计算机对语音信号进行分析处理以判断其所属语言种类的一种技术,是未来的语言辨识-语音识别-机器翻译-语音合成自动语音处理流程的重要一环。 通过对自动语言辨识技术发展史的研究,本文指出特征研究的两个重点问题是新的高效辨识特征的寻找和辨识率与执行代价之间的平衡。本文通过向原始特征中加入动态信息和将Cohen类双线性时频分布技术引入语言辨识特征提取过程两种方法对第一个问题作了有益的探索研究。 传统特征中除了动态差分参数以外全都是静态特征,而帧间动态信息包含着大量的语言辨识信息。通过对时域扩展特征矢量作主分量分析可以得到引入了帧间动态信息的时频主分量特征。其效果最好处的语言辨识率较12维线性预测倒谱系数(LPCC)原始特征提高了10.87个百分点,已达80.18%。 利用Cohen类双线性时频分布在处理非平稳信号上的优势,本文使用Cohen类双线性时频分布在克服了短时平稳假设这一技术限制的情况下完成了对基音频率的提取,获得了美尔频率倒谱系数(MFCC)的改进特征时频美尔频率倒谱系数(TFMFCC),并单独使用Cohen类双线性时频分布提出一种新的类相关核时频分布特征。其中时频美尔频率倒谱系数特征对美尔频率倒谱系数特征的最好改善处有着3.13个百分点的提高,类相关核函数时频分布特征也有着54.95%的辨识率。 实验结果表明了时频主分量特征在引入动态信息上的有效性,并显露出Cohen类双线性时频分布在利用其高时频分辨率和不受短时平稳假设约束的优势提高语言辨识特征性能中具有的潜力。(本文来源于《中国人民解放军信息工程大学》期刊2005-04-01)

自动语言辨识论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果。相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

自动语言辨识论文参考文献

[1].王洪海,刘刚,郭军.基于滑动倒谱的自动语言辨识[J].智能系统学报.2008

[2].张文林,屈丹,李弼程,王波,王炳锡.一种基于段级特征和自动标识的语言辨识算法[J].信号处理.2008

[3].杨焕峥.汉语方言自动辨识系统中的语言建模[J].宁波职业技术学院学报.2007

[4].王洪海,刘刚,郭军.自动语言辨识的研究方法及发展概述[J].电脑与信息技术.2007

[5].王洪海.基于声学特征的自动语言辨识研究[D].北京邮电大学.2007

[6].王洪海,刘刚,郭军.关于网络语音的自动语言辨识系统研究[J].电脑与信息技术.2007

[7].戴冠男,王炳锡,屈丹.基于C_nV结构的自动语言辨识研究[J].计算机工程与应用.2006

[8].沈兆勇,顾明亮.基于符号化和语言模型方法的汉语方言自动辨识[J].徐州师范大学学报(自然科学版).2006

[9].戴冠男,王炳锡,屈丹.基于音素发生率的自动语言辨识[J].信号处理.2006

[10].张强.电话信道中的自动语言辨识技术研究[D].中国人民解放军信息工程大学.2005

标签:;  ;  ;  ;  

自动语言辨识论文-王洪海,刘刚,郭军
下载Doc文档

猜你喜欢