论文摘要
编码域说话人识别是以语音压缩编码的比特流为研究对象,不经过解码过程,直接从编码比特流中提取出语音特征参数进行说话人识别。它是随着现代通信技术的发展新兴的一个的研究领域,涉及到传统的说话人识别技术和语音编码技术,具有广阔的应用前景。论文主要研究编码域说话人识别技术,取得如下三个方面的研究成果。首先,研究了语音编码对说话人识别的影响,提出了基于编码失真的加权GMM模型。此外,采用编码自动匹配方法和分数归一化技术来解决编码不匹配时识别率下降的问题。实验表明,这些方法提高了说话人识别系统的识别率和实用性。然后,提出了GSM FR、G.729和G.723.1三种编码比特流中适合说话人识别的优化特征矢量。首先从三种编码比特流中提取出基本的语音特征参数,然后对其进行特征选择和组合,得到优化特征矢量。实验表明,优化特征矢量具有通用性,与解码后提取的特征矢量相比,能提高说话人识别系统的识别率和运行效率。最后,提出了基于帧选择的VoIP编码域说话人识别方法。通过分析VoIP的传输协议和VoIP编码比特流的特点,设计了VoIP比特流中静音帧和坏帧的检测方法。实验表明,帧选择的方法提高了VoIP编码域说话人识别系统的识别率和运行效率。
论文目录
表目录图目录摘要ABSTRACT第一章 绪论1.1 说话人识别概述1.2 语音编码概述1.3 编码域说话人识别概述1.3.1 研究的必要性和意义1.3.2 发展历史和现状1.4 所用语料库1.5 主要工作及论文组织1.5.1 主要工作1.5.2 论文组织第二章 说话人识别基础2.1 说话人识别系统流程2.2 预处理2.3 特征提取2.3.1 LPC及LPCC2.3.2 基音周期2.4 说话人模型2.4.1 模板匹配模型2.4.2 判别模型2.4.3 概率统计生成模型2.5 分类器判决2.5.1 说话人辨认的情况2.5.2 说话人确认的情况2.6 性能评价2.6.1 说话人辨认的情况2.6.2 说话人确认的情况2.7 小结第三章 语音编码对说话人识别的影响及补偿方法3.1 引言3.2 语音编码对说话人识别的影响3.2.1 对说话人确认系统的影响3.2.2 特征参数的编码失真3.3 基于编码失真的加权GMM模型3.3.1 加权GMM模型3.3.2 权重矩阵C的确定3.3.3 实验及分析3.4 编码自动匹配方法3.4.1 编码自动匹配方法概述3.4.2 语音编码检测器3.4.3 实验及分析3.5 分数归一化方法3.5.1 分数归一化概述3.5.2 实验及分析3.6 小结第四章 编码比特流中的特征提取4.1 引言4.2 现代通信系统中的语音编码技术4.2.1 移动通信中的语音编码4.2.2 VoIP中的语音编码4.3 基于编码比特流的特征提取4.3.1 GSM FR编码比特流中的特征提取4.3.2 G.729编码比特流中的特征提取4.3.3 G.723.1编码比特流中的特征提取4.4 特征选择与组合4.4.1 特征选择4.4.2 特征组合4.5 实验及分析4.5.1 选择LPCC参数4.5.2 选择LPC、LAR和LSP参数4.5.3 选择激励参数4.5.4 优化特征组合4.5.5 通用性分析4.5.6 实验结果比较4.5.7 时间性能分析4.6 小结第五章 基于帧选择的VoIP编码域说话人识别5.1 引言5.2 VoIP中的语音5.2.1 VoIP中语音信号特点5.2.2 语音比特流的RTP封装5.3 基于帧选择的VoIP编码域说话人识别5.3.1 方法流程5.3.2 静音帧检测5.3.3 坏帧检测5.4 实验及分析5.5 小结结束语参考文献作者简历 攻读硕士学位期间完成的主要工作致谢
相关论文文献
标签:说话人识别论文; 语音编码论文; 编码失真论文; 特征选择论文; 帧选择论文;