基于FPGA的嵌入式系统说话人识别算法的研究与实现

基于FPGA的嵌入式系统说话人识别算法的研究与实现

论文摘要

说话人识别是指通过对说话人语音信号的分析处理来自动识别说话人的身份,它在许多领域内有着良好的应用前景。本说话人识别系统是建立在基于FPGA的嵌入式系统之上的,采用了矢量量化的方法,它包括三个主要模块:特征提取、模式匹配和硬件平台。在特征提取过程中,将从说话人的语音信号中提取能够体现个性特征的少量参数,并对提取算法以速度为优先指标进行优化。在模式匹配模块中包含两个部分:一是码书生成步骤,二是识别步骤。在硬件平台模块中,将利用FPGA设计一个SOPC系统,以完成语音信号的采集、人机交互接口等功能,并利用FPGA的并行处理特性对模式匹配的算法进行加速。本文首先在对语音信号的时域处理方法进行研究的基础上,对常用特征参数提取原理和特点进行研究,其中,重点研究了美尔频率倒谱系数的原理和特点,设计和实现了提取步骤。然后,在对主流模式匹配方法的研究基础上,重点研究了矢量量化的方法,并在介绍了矢量量化的原理和失真测度的基础上,研究矢量量化器最优码本设计的算法—遗传算法。接着,对本系统所使用的基于SOPC的硬件平台进行了设计,并设计和实现了硬件模块与软件系统的接口。最后,设计了一套以MFCC为特征参数、以遗传算法为码本设计算法、以矢量量化为模式匹配方法的说话人识别算法,在基于FPGA的嵌入式平台上实现,并对算法进行一系列的软、硬件优化,同时,提出了一种新的失真距离计算方法—分段均值距离法,通过在实际硬件平台上的实验,得出了在增大各码本失真距离间距方面有着较好的效果的结论。本系统采用美尔频率倒谱系数特征参数,提高了系统的识别性能;采用遗传算法进行码书设计,并利用K-均值聚类算法加快码书收敛速度,优化了码书性能;采用分段均值距离法获得较稳定的阈值,提高了系统的拒识率。本系统获得了很高的识别率和拒识率,并具有运算速度快、差错率低、系统硬件要求较低等优点,具备了一定的实用化能力。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 说话人识别研究的背景及意义
  • 1.2 说话人识别研究的现状
  • 1.3 说话人识别研究的内容
  • 1.3.1 说话人识别的系统结构
  • 1.3.2 说话人识别分类及其优缺点
  • 1.3.3 说话人识别需要解决的问题
  • 1.3.4 说话人识别系统的性能评价
  • 1.4 说话人识别研究的技术难点
  • 1.5 论文的主要内容和章节安排
  • 1.6 本章小结
  • 2 语音信号的时域处理和特征参数提取
  • 2.1 语音信号的时域处理
  • 2.1.1 语音采样
  • 2.1.2 预加重
  • 2.1.3 加窗
  • 2.1.4 短时能量
  • 2.1.5 短时平均过零率
  • 2.1.6 端点检测
  • 2.2 特征参数提取
  • 2.2.1 线性预测系数(LPC)
  • 2.2.2 线性预测倒谱系数(LPCC)
  • 2.2.3 Mel 频率倒谱系数(MFCC)
  • 2.3 本章小结
  • 3 主流模式匹配方法
  • 3.1 动态时间弯折算法
  • 3.2 隐马尔可夫模型
  • 3.2.1 隐马尔可夫模型的数学描述
  • 3.2.2 HMM 基本算法
  • 3.3 人工神经网络
  • 3.3.1 神经元的基本结构
  • 3.3.2 神经网络的学习方式
  • 3.3.3 前向网络
  • 3.4 矢量量化算法
  • 3.4.1 矢量量化的基本原理
  • 3.4.2 矢量量化的一般方法
  • 3.4.3 矢量量化的失真测度
  • 3.4.4 码本设计
  • 3.5 本章小结
  • 4 基于FPGA 的嵌入式说话人识别系统硬件平台
  • 4.1 SOPC 设计技术简介和说话人识别系统硬件结构
  • 4.2 语音芯片的配置与采集
  • 4.3 PS/2 键盘接口模块
  • 4.4 适应度计算模块
  • 4.5 本章小结
  • 5 基于嵌入式系统的说话人识别算法实现
  • 5.1 语音数据的采集
  • 5.2 端点检测
  • 5.3 MFCC 特征参数提取和算法优化
  • 5.3.1 MFCC 特征参数提取
  • 5.3.2 算法优化
  • 5.4 基于遗传算法码书生成算法实现
  • 5.4.1 编码与解码
  • 5.4.2 适应度计算与择优遗传
  • 5.4.3 交叉
  • 5.4.4 变异
  • 5.4.5 K-均值聚类与加速
  • 5.5 码书数据的保存
  • 5.6 基于VQ 的识别过程
  • 5.6.1 失真测度
  • 5.6.2 分段距离均值法
  • 5.6.3 硬件加速
  • 5.6.4 判决
  • 5.7 实验及结果
  • 5.7.1 系统识别率和拒绝率测试
  • 5.7.2 不同特征参数对系统识别率的影响
  • 5.7.3 算法软硬件优化对速度的影响
  • 5.7.4 不同失真距离算法对结果的影响
  • 5.8 本章小结
  • 6 结论与展望
  • 致谢
  • 参考文献
  • 附录:作者在攻读硕士学位期间发表的论文目录
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  

    基于FPGA的嵌入式系统说话人识别算法的研究与实现
    下载Doc文档

    猜你喜欢