电话信道中的自动语言辨识技术研究

电话信道中的自动语言辨识技术研究

论文摘要

自动语言辨识技术是建立在语音学、语言学、数字信号处理和模式识别等学科的基础之上,利用计算机对语音信号进行分析处理以判断其所属语言种类的一种技术,是未来的语言辨识-语音识别-机器翻译-语音合成自动语音处理流程的重要一环。 通过对自动语言辨识技术发展史的研究,本文指出特征研究的两个重点问题是新的高效辨识特征的寻找和辨识率与执行代价之间的平衡。本文通过向原始特征中加入动态信息和将Cohen类双线性时频分布技术引入语言辨识特征提取过程两种方法对第一个问题作了有益的探索研究。 传统特征中除了动态差分参数以外全都是静态特征,而帧间动态信息包含着大量的语言辨识信息。通过对时域扩展特征矢量作主分量分析可以得到引入了帧间动态信息的时频主分量特征。其效果最好处的语言辨识率较12维线性预测倒谱系数(LPCC)原始特征提高了10.87个百分点,已达80.18%。 利用Cohen类双线性时频分布在处理非平稳信号上的优势,本文使用Cohen类双线性时频分布在克服了短时平稳假设这一技术限制的情况下完成了对基音频率的提取,获得了美尔频率倒谱系数(MFCC)的改进特征时频美尔频率倒谱系数(TFMFCC),并单独使用Cohen类双线性时频分布提出一种新的类相关核时频分布特征。其中时频美尔频率倒谱系数特征对美尔频率倒谱系数特征的最好改善处有着3.13个百分点的提高,类相关核函数时频分布特征也有着54.95%的辨识率。 实验结果表明了时频主分量特征在引入动态信息上的有效性,并显露出Cohen类双线性时频分布在利用其高时频分辨率和不受短时平稳假设约束的优势提高语言辨识特征性能中具有的潜力。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 自动语言辨识基本原理
  • 1.1.1 语言辨识信息
  • 1.1.2 自动语言辨识系统
  • 1.2 自动语言辨识发展史
  • 1.2.1 语料库
  • 1.2.2 辨识方法
  • 1.3 本论文主要工作
  • 第二章 时频主分量特征
  • 2.1 特征变换
  • 2.1.1 线性判别分析(LDA)
  • 2.1.2 主分量分析(PCA)
  • 2.1.3 独立分量分析(ICA)
  • 2.2 时频主分量特征提取
  • 2.4.1 时频滤波
  • 2.4.2 训练与识别
  • 第三章 COHEN类双线性时频分布
  • 3.1 COHEN类时频分布
  • 3.2 核方法
  • 3.3 与核有关的基本特性
  • 3.4 COHEN类双线性时频分布的四个平面
  • 3.5 实验所用COHEN类双线性时频分布
  • 3.5.1 魏格纳维尔分布(Wigner-Ville Distribution)
  • 3.5.2 玻恩-约尔丹分布(Born-Jordan Distribution)
  • 3.5.3 赵-阿特拉斯-马克斯分布(Zhao-Atlas-Marks Distribution)
  • 3.6 COHEN类分布的离散实现
  • 第四章 利用COHEN类双线性时频分布提取的三种特征
  • 4.1 基音特征
  • 4.2 时频美尔频率倒谱系数
  • 4.2.1 美尔频率倒谱系数
  • 4.2.2 时频美尔倒谱系数
  • 4.3 类相关核时频分布特征
  • 第五章 实验
  • 5.1 语料选取
  • 5.2 模型
  • 5.2.1 高斯混合模型定义
  • 5.2.2 参数调整算法-EM算法
  • 5.3 实验结果
  • 5.3.1 时频主分量特征
  • 5.3.2 基音频率特征
  • 5.3.3 时频美尔倒谱系数特征
  • 5.3.4 类相关核时频分布特征
  • 第六章 总结与展望
  • 6.1 全文总结
  • 6.2 进一步研究方向
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于耳蜗倒谱系数的说话人识别[J]. 电子技术与软件工程 2020(05)
    • [2].基于美尔倒谱系数及隐马尔可夫模型的说话人识别系统研究[J]. 黑龙江科技信息 2012(30)
    • [3].听觉模型倒谱系数及其在声目标识别中的应用[J]. 应用科学学报 2011(01)
    • [4].基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J]. 计算机应用 2012(09)
    • [5].基于MFCC和加权动态特征组合的环境音分类[J]. 计算机与数字工程 2010(02)
    • [6].基于双耳模型的倒谱系数在声目标识别中的应用[J]. 应用声学 2008(05)
    • [7].改进的美尔倒谱系数用于说话人识别研究[J]. 计算机工程与应用 2012(08)
    • [8].基于美尔倒谱系数和复杂性的语种辨识[J]. 计算机工程 2008(19)
    • [9].基于深度学习的录音回放检测[J]. 电子技术与软件工程 2020(16)
    • [10].一种新的抗噪语音特征的提取[J]. 微电子学与计算机 2011(10)
    • [11].基于减少阶数的Mel频谱倒谱系数改进[J]. 中国科技信息 2013(01)
    • [12].基于多特征组合优化的汉语数字语音识别研究[J]. 电子器件 2013(02)
    • [13].一种声纹美尔频率倒谱系数干扰消除算法研究[J]. 计算机仿真 2013(04)
    • [14].Mel频率倒谱系数的提取与改进[J]. 科技信息(科学教研) 2008(15)
    • [15].基于LPCC和MFCC参数的病理嗓音识别研究[J]. 通信技术 2012(01)
    • [16].最小方差无失真响应感知倒谱系数在说话人识别中的应用[J]. 声学学报 2012(06)
    • [17].水下声目标的梅尔倒谱系数智能分类方法[J]. 应用声学 2019(02)
    • [18].基于FPGA的Mel倒谱系数提取方法设计与实现[J]. 仪表技术与传感器 2017(03)
    • [19].基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法[J]. 计算机应用 2019(12)
    • [20].嵌入式语音识别系统特征参数提取研究[J]. 计算机技术与发展 2011(07)
    • [21].一种具有鲁棒特性的Mel频率倒谱系数[J]. 金陵科技学院学报 2008(02)
    • [22].基于Mel频率倒谱系数的心音识别技术研究[J]. 生物医学工程学杂志 2012(06)
    • [23].基于LPCMCC的音频数据检索方法[J]. 计算机工程 2009(11)
    • [24].基于改进梅尔倒谱系数的GIS机械故障诊断方法[J]. 高压电器 2020(09)
    • [25].基于改进反向Mel频率倒谱系数的咳嗽干湿性自动分类[J]. 生物医学工程学杂志 2016(02)
    • [26].基于带阻滤波倒谱系数的回放语音检测算法[J]. 无线通信技术 2019(03)
    • [27].基于MEL频率倒谱系数技术的音控汽车天窗的研究设计[J]. 河南机电高等专科学校学报 2015(02)
    • [28].利用抗噪幂归一化倒谱系数的鸟类声音识别[J]. 电子学报 2013(02)
    • [29].基于梅尔倒谱系数的矿山复杂微震信号自动识别分类方法[J]. 中国安全生产科学技术 2018(12)
    • [30].基于Fisher比的梅尔倒谱系数混合特征提取方法[J]. 计算机应用 2014(02)

    标签:;  ;  ;  ;  

    电话信道中的自动语言辨识技术研究
    下载Doc文档

    猜你喜欢