论文摘要
文本无关的说话人识别,由于其实际应用下的灵活性,而成为语音识别领域的研究重点。自从1999年美国国家标准技术研究所(National Institute of Standards and Technology,NIST)举办的评测中,高斯混合模型——通用背景模型(Gaussian Mixture Model - Universal Background Model,GMM-UBM)作为基准系统获得优异识别率后,该方向的研究都以其为基准模型,并对其进行改进。尽管说话人识别系统已经取得了比较令人满意的效果,但进行匹配前需大量的似然分计算,由于该因素的影响使得系统识别速度明显下降,因此实用性不佳。本文的主要目的是在尽量不降低识别率的前提下,减少计算量以实现快速说话人识别。针对说话人识别中计算量大、运行速度慢的情况,本文在基于树形结构的核心挑选算法基础上进行改进,自顶向下搜索UBM中输出测试语音特征矢量似然分最高的分布,此后与目标说话人模型匹配时,只需计算核心分布的似然分进行识别。改进算法应用到基准系统后,核心挑选速度提高了14.7倍。鉴于特征序列对最终的识别结果无影响,因此系统结合矢量序列重排的剪枝算法后,整个系统速度提高到21.7倍,识别率略有降低。为了提高识别率,论文中将支持向量机(Support Vector Machine,SVM)中径向基核函数引入到说话人识别中,识别率提高到与基准系统一致。本文针对女性声音在开集识别时识别率下降明显的情况提出了概率阈值的思想,应用于基准系统后速度有所下降,识别率提高了0.7%。同时对分段置信分改进来解决部分匹配情况对最终识别结果的影响,本文中采用不同的参数来进行实验比较,最终选择每一小段的平均值作为该段的置信分,然后通过三层前馈网络形成最后的置信分,实验证明与使用似然比的基准系统比较,集内正确率提高了2.6%,集外错误率下降了2%。
论文目录
相关论文文献
- [1].基于两种GMM-UBM多维概率输出的SVM语音情感识别[J]. 计算机应用研究 2011(01)
- [2].GMM-UBM声纹识别技术研究与应用[J]. 电脑编程技巧与维护 2017(16)
- [3].基于GMM-UBM模型的说话人辨识研究[J]. 无线电工程 2014(12)
- [4].基于GMM-UBM说话人模型的连续自适应算法研究[J]. 通信电源技术 2016(02)
- [5].一种改进的基于GMM-UBM的法庭自动说话人识别系统[J]. 中国科学院大学学报 2013(06)
- [6].基于GMM-UBM的声纹识别技术的特征参数研究[J]. 计算机技术与发展 2020(05)
- [7].基于超音段韵律特征和GMM-UBM的文本无关的说话人识别[J]. 中国科学技术大学学报 2010(02)
- [8].GMM-UBM和SVM说话人辨认系统及融合的分析[J]. 清华大学学报(自然科学版) 2008(S1)
- [9].基于GMM-UBM的说话人确认系统的研究[J]. 辽宁工业大学学报(自然科学版) 2012(02)
- [10].GMM-UBM和SVM在说话人识别中的应用[J]. 计算机系统应用 2018(01)
- [11].基于GMM-UBM和GLDS-SVM的英文发音错误检测方法[J]. 自动化学报 2010(02)
- [12].一种用于鲁棒性说话人确认的分段概率分布参数规整方法[J]. 电路与系统学报 2008(06)