舰船VDR人声识别技术研究

舰船VDR人声识别技术研究

论文摘要

人声识别系统的鲁棒性(Robustness)是影响其走向实际应用的关键,其中噪声和变异是影响系统鲁棒性的主要因素。由于人声模型较难以建立,所以对于非特定人的识别就更为困难。在对噪声影响的研究中人们发现,随着外界噪声强度的增加,人的情绪和发音方式也会发生变化。本文主要研究舰船航行数据记录仪(Voyage Data Recorder, VDR)环境下的人声识别,分别从基于特征和基于模型角度提出可以在噪声环境下进行人声识别的有效方法。从基于特征的角度出发:首先根据人耳对不同频段的感知程度不同,提出了结合人耳响度特性的子带分频加权算法来降低噪声对MFCC的影响,加权的原则是对识别贡献率较大的子带赋予相对较高的权值,反之则赋予相对较低的权值;其次,针对语音产生过程中存在的非线性现象,通过对非线性AM-FM模型的深入研究,本文提出了改进的MFCC特征系数加权算法,使用该算法提取的MFCC特征能有效利用语音信号中的幅值包络和瞬时频率信息,同时又兼顾了耳蜗子带分频特性,使系统的识别率有一定的提高。同时,采用最大相对熵权值对MFCC特征系数加权,一定程度上解决了不同特征维受环境影响不同的问题,提高了系统的鲁棒性。从基于模型的角度出发:采用Reynolds提出的自适应目标模型方法为人声建立公共背景模型GMM-UBM,并提出了一种基于GMM-UBM的开集动态阈值搜索算法。该算法可以对系统阈值进行动态跟踪设定,实现了系统开集状态下的人声识别,GMM-UBM具有屏蔽背景噪声的作用,不仅很好的解决了模型的训练速度问题,而且使用小训练样本就可以训练出与人声UBM模型具有相同混合度的话者模型,进一步提高了人声识别系统的性能。另外,在预处理阶段提出了基于近似熵的动态自适应阈值端点检测算法,较好的解决了舰船噪声对识别系统的影响,试验结果证明该算法优于自适应子带谱熵端点检测方法。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的来源、目的和意义
  • 1.2 国内外相关技术发展综述
  • 1.2.1 VDR发展概况
  • 1.2.2 人声识别技术发展现状及分类特点
  • 1.2.3 国内外语音识别技术概况
  • 1.3 VDR人声识别系统分析
  • 1.4 人声识别模式匹配方法研究概况
  • 1.4.1 模板匹配法
  • 1.4.2 概率统计法
  • 1.4.3 辨别分类器法
  • 1.5 论文的主要研究工作
  • 第2章 人声识别建模技术研究
  • 2.1 引言
  • 2.2 语音的声学模型和数学模型
  • 2.2.1 语音产生的声学原理
  • 2.2.2 语音信号的数学模型
  • 2.3 基准识别系统及研究平台
  • 2.3.1 语料库
  • 2.3.2 实验平台
  • 2.3.3 声学模型选择
  • 2.4 高斯混合模型(GMM)研究
  • 2.4.1 GMM模型三参数
  • 2.4.2 GMM模型训练(EM迭代)算法
  • 2.4.3 判决阈值Thres的设定
  • 2.4.4 实验结果与分析
  • DTSV'>2.5 改进的动态阈值算法ThresDTSV
  • 2.6 基准识别系统测试
  • 2.6.1 人声识别系统性能评价方法
  • 2.6.2 实验结果与分析
  • 2.7 本章小结
  • 第3章 语音信号端点检测研究
  • 3.1 引言
  • 3.2 语音端点检测算法研究
  • n和短时平均幅度Mn的计算'>3.2.1 短时能量En和短时平均幅度Mn的计算
  • 3.2.2 短时能量结合过零率的端点检测
  • 3.2.3 频带方差D算子求解
  • cep的求解'>3.2.4 倒谱距离d'cep的求解
  • 3.2.5 基于自适应子带熵H(m)的语音端点检测
  • 3.3 基于近似熵的端点检测算法研究
  • 3.3.1 近似熵ApEn算法研究
  • 3.3.2 基于近似熵的语音端点检测与改进
  • 3.3.3 改进的自适应阈值与ApEn参数调整
  • 3.4 实验结果与分析
  • 3.5 本章小结
  • 第4章 VDR人声识别特征提取研究
  • 4.1 引言
  • 4.2 LPCC和MFCC特征比较分析
  • 4.2.1 LPCC特征提取算法
  • 4.2.2 实验结果及分析
  • 4.3 基于听觉掩蔽特性的MFCC特征提取
  • 4.3.1 听觉掩蔽特性的MFCC
  • mel掩蔽特性的MFCC与改进'>4.3.2 barkmel掩蔽特性的MFCC与改进
  • 4.3.3 实验结果与分析
  • 4.4 基于等响特性的MFCC信噪比加权
  • 4.4.1 等响信噪比加权的MFCC
  • 4.4.2 基于耳蜗分频特性的MFCC与改进
  • 4.4.3 实验结果与分析
  • 4.5 鲁棒的MFCC特征提取方法研究
  • 4.5.1 基于AM-FM模型的鲁棒特征
  • 4.5.2 TEO能量算子及ESA能量分离算法
  • 4.5.3 基于AM-FM模型的鲁棒特征提取
  • 4.5.4 基于TEO算子的TEO-MFCC特征系数加权算法
  • 4.6 试验结果与分析
  • 4.7 本章小结
  • 第5章 VDR人声识别模型研究
  • 5.1 引言
  • 5.2 GMM-UBM框架分析
  • 5.3 GMM-UBM模型MAP训练算法研究
  • UBM'>5.4 基于GMM-UBM的开集动态阈值算法ThresUBM
  • 5.5 实验结果与分析
  • 5.6 本章小结
  • 结论
  • 参考文献
  • 攻读博士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].端点检测与响应技术及其发展趋势[J]. 通信技术 2017(07)
    • [2].基于端点检测的时延估计方法的研究[J]. 信息化建设 2015(09)
    • [3].佤语语音语料端点检测算法[J]. 云南民族大学学报(自然科学版) 2019(02)
    • [4].基于元音检测的俄语语音音节端点检测[J]. 郑州大学学报(理学版) 2017(04)
    • [5].低信噪比下的端点检测算法研究[J]. 西北师范大学学报(自然科学版) 2016(05)
    • [6].关于欺骗技术和EDR的4件事[J]. 计算机与网络 2019(08)
    • [7].基于基音频能值的端点检测算法[J]. 安徽工程科技学院学报(自然科学版) 2008(03)
    • [8].基于双门限算法的端点检测改进研究[J]. 计算机与数字工程 2017(11)
    • [9].一种用于橡胶树采胶的自动割胶机[J]. 橡塑技术与装备 2018(11)
    • [10].电话信道人名识别系统的端点检测方法[J]. 心智与计算 2008(02)
    • [11].一种融合时频信息的钢琴音符端点检测算法[J]. 科技与创新 2018(13)
    • [12].复杂环境中多音节语音自适应端点检测的实现[J]. 计算机仿真 2018(07)
    • [13].面向噪声环境下医疗语音信号端点检测方法[J]. 常熟理工学院学报 2017(04)
    • [14].基于压缩感知和MFCC的语音端点检测算法[J]. 测控技术 2019(05)
    • [15].多窗谱减法和EMD改进的新型能熵比端点检测[J]. 电声技术 2019(09)
    • [16].基于端点检测的时频峰值滤波动液面提取技术[J]. 西南石油大学学报(自然科学版) 2018(02)
    • [17].分形理论在语音信号端点检测及增强中的运用[J]. 电脑知识与技术 2018(02)
    • [18].语音端点检测方法探析[J]. 电子技术与软件工程 2014(17)
    • [19].基于Matlab的语音识别端点检测算法研究与实现[J]. 内江科技 2013(09)
    • [20].基于LPC距离和变窗长的端点检测[J]. 电子测量技术 2017(12)
    • [21].基于小波包Bark子带方差的端点检测算法[J]. 洛阳师范学院学报 2019(02)
    • [22].室内声环境中的语音端点检测自适应算法[J]. 电声技术 2012(10)
    • [23].基于LPCC和能量熵的端点检测[J]. 电讯技术 2010(06)
    • [24].基于短时特征双阈值检测的话音信号端点检测算法[J]. 陇东学院学报 2018(05)
    • [25].连续汉语语音切分技术研究[J]. 计算机与数字工程 2019(07)
    • [26].一种面向智能家居的语音端点检测方法仿真[J]. 湖南科技学院学报 2017(10)
    • [27].基于Mel-TEO的带噪语音端点检测算法[J]. 微电子学与计算机 2016(04)
    • [28].一种改进的基于倒谱距离端点检测方法研究[J]. 计算机与数字工程 2013(07)
    • [29].递归分析在带噪语音端点检测中的应用[J]. 沈阳航空航天大学学报 2017(06)
    • [30].“异常行为”如何寻? EDR“显神威”[J]. 网络安全和信息化 2017(04)

    标签:;  ;  ;  ;  ;  ;  

    舰船VDR人声识别技术研究
    下载Doc文档

    猜你喜欢