基于说话人识别的公安语音筛选系统设计与实现

基于说话人识别的公安语音筛选系统设计与实现

论文摘要

随着通讯技术的发展,越来越多的案件要求公安机关从大量的语音信息中提取犯罪嫌疑人的声音。然而,由于语音处理固有的难度,目前公安机关仍然采用人工查找语音库的方式来获得犯罪嫌疑人的语音。为了解决从海量语音中提取特定说话人语音这一难题,我国许多公安机关都在探索将说话人识别技术引入公安语音处理。在上述背景下,我们详细研究了说话人识别的基本原理和实现步骤,总结了公安现有语音处理工作的需求,实现了B/S结构的公安语音筛选系统。该系统主要功能有:声纹库的建立、单一语音与若干说话人模型的比对、特定说话人模型在一批语音中的比对、实时自动比对。这些系统功能涵盖了现阶段公安工作对语音筛查的要求,解决实际工作中遇到的海量语音数据与有限办案警力之间的矛盾,力图达到将说话人识别类比指纹识别,使之成为继指纹识别之后又一有力的侦查武器。本文主要工作如下:(1)首先对语音信号进行预处理。在此过程中,我们研究了语音信号的端点检测、分段和分类等技术,实现了系统的预处理过程。通过这个预处理过程,达到了剔除语音中的静音、电话双音频回铃音等无效语音,并将双人合成语音分离成两路单人语音;(2)目前流行的说话人识别所处理的对象大多不是原始的语音信号,而首先进行说话人特征参数提取。我们研究了利用了听觉原理和倒谱的解相关特性的Mel倒谱参数,实现了Mel倒谱参数的提取过程;(3)在系统实现上,说话人识别是系统的核心模块。我们研究了在说话人识别中取得巨大成功,并在说话人识别领域中广泛应用的高斯混合模型-统一背景模型(Gaussian Mixture Model - Universal Background Model , GMM-UBM)的框架结构,实现了基于该框架结构的说话人模型的训练和识别过程;(4)在上述具体技术基础上,我们进行了公安语音筛选系统的设计和实现。其中主要包括了系统整体框架设计、功能模块划分和数据库表结构的设计。最终实现并构建了整个系统。最后,我们进行了基于实际公安语音库的筛选比对实验。实验结果表明对于大多数的公安语音筛选应用,系统给出了比原有的语音量小得多的筛选结果,对这个筛选结果再进行很小工作量的人工筛选就可以得到满意的结果。从而提高工作效率,降低工作强度,达到辅助侦查工作的目的。本文做了以下创新工作:(1)实现了说话人识别在厦门市公安局的应用。说话人识别在我国公安机关的使用尚属起步阶段,说话人识别在厦门市公安局的应用尚属首次;(2)将说话人识别类比指纹识别,建立厦门市公安局的“声纹库”。“声纹库”的建设是刑事侦查活动适应新型刑事犯罪活动的需求,是对指纹库的有力补充。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 课题研究背景与意义
  • 1.2 国内外研究现状
  • 1.3 论文主要工作
  • 1.4 论文结构安排
  • 2 公安语音筛选系统的总体设计
  • 2.1 公安语音筛选系统整体框架
  • 2.2 系统整体环境
  • 2.3 公安语音数据库
  • 2.4 系统主要功能模块
  • 2.5 本章小结
  • 3 语音预处理
  • 3.1 引言
  • 3.2 语音帧的形成
  • 3.3 语音检测
  • 3.4 铃音检测
  • 3.5 语音分段方法
  • 3.5.1 常见的语音分段方法
  • 3.5.2 公安语音筛选系统的语音分段
  • 3.6 公安语音筛选系统的语音聚类
  • 3.7 公安语音筛选系统语音预处理的实现
  • 3.8 本章小结
  • 4 语音说话人特征提取模块
  • 4.1 引言
  • 4.2 说话人识别系统中常用的特征
  • 4.3 感知频域倒谱分析与Mel 倒谱参数
  • 4.3.1 Mel 倒谱参数
  • 4.3.2 Mel 倒谱参数的提取
  • 4.4 公安语音筛选系统特征提取模块的实现
  • 4.5 本章小结
  • 5 语音说话人模型训练与识别模块
  • 5.1 引言
  • 5.2 基本的说话人识别技术
  • 5.3 基于高斯混合模型的说话人识别
  • 5.4 高斯混合模型-统一背景模型框架结构的说话人模型训练与识别
  • 5.4.1 基本原理
  • 5.4.2 实现算法
  • 5.5 公安语音筛选系统训练与识别模块的实现
  • 5.6 本章小结
  • 6 语音筛选系统数据库设计
  • 6.1 引言
  • 6.2 声纹库的数据库设计
  • 6.3 声纹比对的数据库设计
  • 6.4 本章小结
  • 7 公安语音筛选系统的实现
  • 7.1 引言
  • 7.2 公安语音声纹库
  • 7.3 公安语音说话人模型检出
  • 7.4 公安说话人语音检出
  • 7.5 公安说话人语音自动比对
  • 7.6 本章小结
  • 8 测试与验证
  • 8.1 评价系统的性能指标
  • 8.2 测试结果与分析
  • 8.3 本章小结
  • 9 结论
  • 9.1 本文总结
  • 9.2 工作展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 上海交通大学学位论文答辩决议书
  • 相关论文文献

    • [1].基于翻转梅尔频率倒谱系数的语音变调检测方法[J]. 计算机应用 2019(12)
    • [2].语音助手能力评估研究及趋势分析[J]. 广东通信技术 2019(12)
    • [3].语音伪造与鉴伪的发展与挑战[J]. 信息安全学报 2020(02)
    • [4].广告语中语音隐喻的使用规则研究[J]. 传播力研究 2020(03)
    • [5].阻止语音欺诈的7种方法[J]. 计算机与网络 2020(09)
    • [6].5G初期语音业务方案与优化策略[J]. 广西通信技术 2019(03)
    • [7].在线语音直播发展动因探析[J]. 视听 2020(09)
    • [8].在线语音直播的兴起与发展探析[J]. 新闻研究导刊 2018(07)
    • [9].基于噪声分类和字典选择的语音活动检测[J]. 华中科技大学学报(自然科学版) 2016(12)
    • [10].语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J]. 物流技术 2017(01)
    • [11].一种基于语音活动检测的声源定位方法[J]. 电脑知识与技术 2017(04)
    • [12].互联网时代语音业务发展的思考分析[J]. 中国新通信 2017(08)
    • [13].一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J]. 华东理工大学学报(自然科学版) 2017(04)
    • [14].语音中继主叫号码的限制[J]. 通讯世界 2017(18)
    • [15].在线语音直播开启直播新战场[J]. 新闻战线 2017(21)
    • [16].基于同轴的广电语音业务的实现[J]. 中国有线电视 2016(08)
    • [17].瑜伽语音冥想对大学生心理健康的积极影响[J]. 赤子(上中旬) 2014(15)
    • [18].语音感知和语音产出——二语语音习得研究梳辨[J]. 语文学刊(外语教育教学) 2015(04)
    • [19].国内外语语音能力研究论析[J]. 宿州学院学报 2015(06)
    • [20].关于语音转换实现的研究[J]. 价值工程 2015(29)
    • [21].浅析语音导览系统在博物馆中的应用[J]. 学理论 2015(32)
    • [22].冷,冷,冷[J]. 意林(原创版) 2019(02)
    • [23].【微信小课堂】:如何将语音转化为文字[J]. 晚晴 2019(08)
    • [24].网上语音祝福免费送[J]. 电脑迷 2009(12)
    • [25].用语音故事开启孩子的阅读之旅[J]. 内蒙古教育 2019(14)
    • [26].浅谈课堂教学的语音艺术[J]. 中国教师 2013(S2)
    • [27].对方正在输入……[J]. 小说界 2018(05)
    • [28].魔力语音[J]. 阅读 2018(69)
    • [29].国内外二语音系研究现状及趋势[J]. 青年文学家 2015(12)
    • [30].语音报时 定时备忘提醒工具[J]. 网友世界 2010(Z1)

    标签:;  ;  ;  ;  

    基于说话人识别的公安语音筛选系统设计与实现
    下载Doc文档

    猜你喜欢