基于HMM的自动唱词定位系统的设计与实现

基于HMM的自动唱词定位系统的设计与实现

论文摘要

字幕唱词信息帮助观众对音视频内容进行理解,在音视频文件中有着非常重要的作用。本文针对唱词定位系统的要求和特点,采用基于隐马尔可夫模型(HMM)的训练算法,实现了可以在复杂背景噪声的情况下,从连续的音频信号中提取语音端点,并结合唱词进行精确定位最后生成字幕的自动系统。本文简要介绍了HMM在语音处理中的应用,并针对大词汇量,非特定人的汉语连续语音模型训练的特点,研究了系统中声学模型的构造和音频参数的选择,采用39维的MFCC参数和对音素建模进行汉语语音HMM模型的训练。在此基础上,利用唱词文件提供的字幕文本信息,将音素HMM模型前后级联成语句HMM模型,并采用令牌传递算法对音频句子进行分割,实现唱词与音频的对齐功能。最后实现了自动生成字幕的唱词精确定位系统,进一步验证了本文提出技术的可行性。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究背景
  • 1.2 语音识别技术的历史与研究现状
  • 1.3 论文内容和意义
  • 1.4 论文的总体结构
  • 第二章 语音处理的基本理论
  • 2.1 语音信号的表示
  • 2.1.1 语音信号的时域波形
  • 2.1.2 语音信号的频域波形
  • 2.2 语音信号处理
  • 2.3 语音信号特征参数提取
  • 2.3.1 语音信号的时域分析
  • 2.3.2 语音信号频域分析
  • 2.3.3 动态参数
  • 第三章 隐马尔科夫模型及其在语音识别中的应用
  • 3.1 HMM的定义
  • 3.2 HMM的基本算法
  • 3.2.1 前向-后向算法
  • 3.2.2 Viterbi算法
  • 3.2.3 Baum-Welch算法
  • 3.3 HMM模型在语音识别系统中的应用
  • 3.3.1 语音识别系统结构
  • 3.3.2 语音识别的分类
  • 3.3.3 HMM在孤立词识别中的应用
  • 3.3.4 HMM在连续词识别中的应用
  • 第四章 基于HMM的自动唱词定位技术研究
  • 4.1 特征参数选取
  • 4.2 声学模型的选择
  • 4.3 单音素HMM模型的建立与训练
  • 4.3.1 训练数据的准备
  • 4.3.2 单音素模型参数初始化
  • 4.3.3 单音素模型的训练
  • 4.4 语句段HMM模型的建立与识别
  • 4.4.1 令牌传递模型
  • 第五章 原型系统的设计与实现
  • 5.1 系统概述
  • 5.2 用户界面模块的设计与实现
  • 5.3 音频参数提取模块的设计与实现
  • 5.3.1 wav文件读取子模块的设计与实现
  • 5.3.2 MFCC参数提取子模块的设计与实现
  • 5.4 唱词音节转换模块的设计与实现
  • 5.5 音频唱词对齐模块的设计与实现
  • 5.6 字幕生成模块的设计与实现
  • 5.7 字幕播放模块的设计与实现
  • 第六章 自动字幕生成系统应用效果展示
  • 6.1 系统界面
  • 6.1.1 系统输入
  • 6.1.2 系统按钮
  • 6.2 生成字幕文件
  • 6.3 视频播放及字幕加载
  • 6.4 自动唱词定位及字幕生成的效率
  • 第七章 总结与展望
  • 7.1 全文总结
  • 7.2 未来工作展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 相关论文文献

    • [1].人员定位系统在发电企业管理中的应用[J]. 信息记录材料 2019(11)
    • [2].基于安卓的移动报警定位系统[J]. 计算机产品与流通 2020(02)
    • [3].“硬核”定位系统入驻兖矿集团,精确度以厘米计算[J]. 山东煤炭科技 2020(01)
    • [4].KPCA-IWKNN-BFPLN混合式楼宇内定位系统[J]. 计算机应用与软件 2020(03)
    • [5].浅谈驾考车定位系统的硬件测试[J]. 农家参谋 2020(12)
    • [6].基于注胶工艺的数控转台四点定位系统设计[J]. 制造技术与机床 2020(10)
    • [7].四单元联动智能柔性定位系统研究[J]. 机电工程技术 2020(09)
    • [8].天津市生猪贩运车辆加装GPS定位系统[J]. 江西畜牧兽医杂志 2018(05)
    • [9].防走失定位系统开发与设计[J]. 现代商贸工业 2017(07)
    • [10].量子定位系统技术发展及其对导弹武器发展的影响[J]. 导航定位与授时 2014(02)
    • [11].人员定位系统在煤矿安全管理中的几点思考[J]. 山东工业技术 2014(22)
    • [12].上海大众缸盖机加工线零点定位系统的应用[J]. 柴油机设计与制造 2015(02)
    • [13].回音定位系统[J]. 发明与创新(综合版) 2009(08)
    • [14].回音定位系统可助盲人导航[J]. 发明与创新(综合版) 2009(08)
    • [15].智能拐杖[J]. 快乐语文 2016(33)
    • [16].共享单车,共享生活[J]. 少年电脑世界 2017(05)
    • [17].大地向我们打开锦囊[J]. 雪莲 2017(07)
    • [18].基于RFID的智能滑雪场定位系统研究[J]. 报刊荟萃 2017(07)
    • [19].基于个人定位系统的研究与思考[J]. 环球市场信息导报 2017(02)
    • [20].激波定位系统多通道时延检测研究[J]. 电子世界 2020(05)
    • [21].基于北斗的室内外无缝定位系统[J]. 中国新通信 2020(03)
    • [22].浅谈人员定位系统在煤矿运行中存在的问题及对策[J]. 能源与环境 2019(03)
    • [23].天津市生猪贩运车辆加装GPS定位系统[J]. 湖北畜牧兽医 2018(11)
    • [24].基于哈希函数的矿用RFID定位系统研究[J]. 中国仪器仪表 2017(01)
    • [25].人员定位系统在焦家金矿的应用[J]. 南方农机 2017(14)
    • [26].配电网接地故障定位系统的优化设计实现[J]. 现代电子技术 2016(06)
    • [27].老人安全助行拐杖[J]. 学苑创造(7-9年级阅读) 2020(10)
    • [28].人员定位系统的组成及重要性[J]. 煤 2011(08)
    • [29].120医疗急救移动报警定位系统研究[J]. 医学信息(中旬刊) 2010(07)
    • [30].全球导航与定位系统现状及面临的挑战[J]. 汽车与配件 2010(40)

    标签:;  ;  ;  ;  

    基于HMM的自动唱词定位系统的设计与实现
    下载Doc文档

    猜你喜欢