基于内容的音频匹配研究

基于内容的音频匹配研究

论文摘要

随着多媒体技术和互联网的发展,数字化的音乐音频的数据量急剧增多,如何对音乐音频信息进行快速准确的分析显得日益迫切。当前音乐信息的分析与检索还是基于文本标签信息为主,这需要繁重的人工代价,且极易出现错误而影响结果。与此同时,基于内容的音乐信息分析检索技术正蓬勃发展,其重点是如何使计算机能够像人一样能够理解、分析音乐中所包含的丰富内容。本文从京剧音乐音频的匹配问题展开,根据音乐特征的音色信息,提出了一个提取音频音色序列的方法,以音色序列的形式再现音频数据。而音色序列包含了音乐音频的听觉感受信息,采用基于时间序列技术的音色序列匹配方法,解决音频间的匹配问题。通过分析发声体发声机理以及不同音色的音频特征间的差异与联系,本文引入了音频的音色分布度量,从整体上分析音频信号在音色上的特征。利用发声过程的特性和京剧音频的特点,提出了一个结合高斯混合模型与隐马尔可夫模型技术的音色序列提取方法。在音乐音频匹配方面,结合声音音色的听觉感受和时间序列的相似性度量,引入京剧音乐音频片段的音色序列相似性度量。在匹配过程时,音频片段的时间长度不尽相同,为了解决不同时长音频的匹配问题,本文提出基于滑动窗口技术的音频匹配算法框架。以此建立了一个京剧音乐音频匹配系统,在该系统中,可以使用不同的音频信号特征提取方式,选取不同的时间序列相似性度量,实现快速灵活的音频片段匹配。实验结果表明,以该算法来进行音频片段匹配速度快、可控性好、反应延迟小;对原始查询音频片段的部分缺失问题及噪音所造成的影响来说,均具有很好的鲁棒性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 表示级别音频分析
  • 1.2.2 语义级别音频分析
  • 1.3 本文的研究内容
  • 第二章 京剧音频的特征提取与分类
  • 2.1 声音的听觉特性
  • 2.2 音频的特征提取
  • 2.2.1 时域特征
  • 2.2.2 频域特征
  • 2.2.3 倒谱特征
  • 2.2.4 音调特征
  • 2.3 特征的分类
  • 2.4 音频特征提取及分类试验
  • 2.4.1 预处理
  • 2.4.2 提取特征
  • 2.4.3 分类结果及分析
  • 第三章 音频的音色序列提取
  • 3.1 短时音色特征
  • 3.2 音频片段的音色序列
  • 3.2.1 隐马尔可夫模型
  • 3.2.2 提取音色序列模型
  • 3.3 音色序列分析
  • 3.4 音色序列提取实验结果及讨论
  • 3.4.1 评价标准
  • 3.4.2 实验结果及分析
  • 第四章 基于音色序列的音频匹配
  • 4.1 时间序列的匹配
  • 4.1.1 时间序列的相似性
  • 4.1.2 时间序列的变形及噪音问题
  • 4.1.3 时间序列的相似性度量
  • 4.2 音色序列的匹配研究
  • 4.2.1 定长音色序列的匹配问题
  • 4.2.2 基于滑动窗口的音色序列匹配
  • 4.3 音频匹配实验结果及讨论
  • 4.3.1 系统功能和机构设计
  • 4.3.2 实验评测
  • 第五章 结论和展望
  • 参考文献
  • 致谢
  • 附录1:作者攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].音频娱乐的最大市场在哪里[J]. 上海广播电视研究 2019(03)
    • [2].用户思维与数据思维驱动优质音频创作[J]. 青年记者 2019(36)
    • [3].智媒时代的音频产业:盈利模式与路径创新[J]. 现代视听 2019(11)
    • [4].融合思维下音频媒体的智能化转向探究[J]. 传媒论坛 2020(03)
    • [5].多通道音频采集前端硬件设计[J]. 科技创新与应用 2020(08)
    • [6].在线音频平台内容付费市场分析[J]. 新闻战线 2019(24)
    • [7].机构媒体音频化发展背景下的人才变革[J]. 南方传媒研究 2019(06)
    • [8].付费音频平台的发展瓶颈与营销策略[J]. 青年记者 2019(33)
    • [9].用户体验视角下的音频知识付费平台主要缺陷与应对策略研究[J]. 声屏世界 2020(04)
    • [10].短音频会成为传统广播的新风口吗?[J]. 视听 2020(06)
    • [11].广播电台音频网的安装与维护[J]. 科技传播 2020(13)
    • [12].音频新闻:脉络、演进与特征[J]. 青年记者 2020(19)
    • [13].基于音频指纹的广播电台内容监测识别技术[J]. 西部广播电视 2020(17)
    • [14].中国移动音频平台营销策略及其启示[J]. 中国传媒科技 2020(08)
    • [15].智能网联时代车载音频的内容生产与运营研究——以听伴为例[J]. 东南传播 2020(09)
    • [16].移动互联网音频平台主持人特色[J]. 戏剧之家 2019(12)
    • [17].付费模式对音频出版的助力研究[J]. 传播力研究 2019(13)
    • [18].“新科技”元年:围绕用户发力声音价值[J]. 声屏世界·广告人 2017(02)
    • [19].基于云架构的音频采录拆条系统的设计与实现[J]. 电声技术 2017(03)
    • [20].基于凝聚信息瓶颈的音频事件聚类方法[J]. 电子学报 2017(05)
    • [21].张弛有度——如何把控音频节目节奏[J]. 影视制作 2017(03)
    • [22].录音设备安装与调试中音频干扰的来源与消除[J]. 电子世界 2017(18)
    • [23].生活中的科技[J]. 初中生 2019(Z6)
    • [24].《音频的编辑》教学设计[J]. 中国信息技术教育 2020(18)
    • [25].《音频基础》课程的设计与教学[J]. 中国文艺家 2020(10)
    • [26].基于倒谱分析的实时广播音频相似度快速比对算法[J]. 工程科学与技术 2020(03)
    • [27].基于球谐域三维音频直播系统的实现[J]. 电声技术 2020(04)
    • [28].浅析音频节目可视化的机遇与挑战——以《朋友请听好》为例[J]. 传播力研究 2020(07)
    • [29].基于压缩感知和音频指纹的固定音频检索方法[J]. 计算机系统应用 2020(08)
    • [30].论标准技术流程里的艺术呈现——里约奥运乒乓球音频公共信号制作[J]. 现代电视技术 2017(03)

    标签:;  ;  ;  ;  ;  

    基于内容的音频匹配研究
    下载Doc文档

    猜你喜欢