说话人识别技术因其独特的方便性、经济性和准确性,在生物特征识别领域中具有广阔的应用前景。现有的说话人识别技术在理想条件下效果很好,但在实际环境中却由于各种因素的影响,不能得到普遍的应用,其中最重要的一个原因是大训练量和实时性不够。因此如何在不影响识别率的情况下,提高系统的训练时间和识别时间成为本领域的研究热点。SVM是一种基于结构风险最小化原则的模式分类方法,在处理样本中非线性、高维数问题时有很大的优势,应用于基于语音样本的说话人识别上有良好的效果。本文深入研究了SVM在说话识别中的大样本训练,及识别时需要匹配所有的参考模型等问题,并提出自己的解决方案。具体做了如下几方面的工作:1、针对标准SVM在说话人识别中的大样本训练问题,提出一个基于多约简支持向量机(MRSVM)的说话人辨识方法,既采用PCA变换和模糊核聚类分别减少训练样本的维数和个数,在不影响识别率的情况下,减少了标准SVM的训练量和系统存储量。2、提出一个基于PCA和MRSVM的多级说话人辨识方法,提高系统的辨识速度。利用PCA分类器具有无需训练、实现简单、快捷的优点。识别时用PCA对注册说话人进行快速预判决。利用SVM具有很强分类能力的优点,根据预判决的结果只判决一部分MRSVM的个数,从而减少了系统的辨识时间。相对于传统的识别方法,实验结果表明本文方法具有很大的时间优势,且整个系统具有很好的可扩性。
本文来源: https://www.lw50.cn/article/38126cfd2cc5fbd1a4aa69ff.html