基于内容的音频检索研究

基于内容的音频检索研究

论文摘要

声音媒体是除视觉媒体外最重要的媒体,随着可利用的多媒体资源迅速增加,如何对其进行有效的查找,已成为多媒体与信息检索技术一个重要的研究课题。在基于内容的音频检索技术中,最基本的是对音频的特征进行提取,不同的特征对音频分类和检索的准确性产生不同的效果。除特征的选择外,搜索匹配的方法也会影响检索的准确性。在音频分类方面,为了有效地区分人发出的声音和含乐器音乐背景的声音,引入了低幅度信号率这一特征;为区分语音和哼唱,引入了总体波形散乱度这一特征。低幅度信号率是指在非静音区域信号幅度较低的采样点所占的比例,实验测试显示,人发出的声音低幅度信号所占的比例通常比较高,而含乐器音乐背景的声音低幅度信号所占的比例通常较低。总体波形散乱度是声音的时域波形图形的散乱程度,语音的总体波形较哼唱散乱,找到一个合适的衡量波形散乱度的方法就能够在一定程度上区分语音和哼唱。在音频检索方面,主要研究了哼唱乐曲检索和音频例子检索技术。哼唱乐曲检索的特征提取从音频帧的频率分析着眼,结合各类型声音的特点,对哼调和口哨曲调的音频主要根据音频帧最大响度音符跳跃程度进行音符切分和提取,对清唱曲调的音频主要根据突出频带的跳跃程度进行音符切分和提取,并在搜索匹配中根据不同音符所占比例及偏差程度进行相似度衡量。在音频例子检索中,利用小波变换对Mel倒谱系数提取中的频带划分和系数选取做了改进,并对分段搜索时序性要求进行了分析,给出了判定是否符合时序性要求的计算方法。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究问题的提出
  • 1.2 国内外研究现状
  • 1.3 主要研究内容
  • 2 音频特征分析及分类
  • 2.1 声音的听觉特性
  • 2.2 音频信号的预处理
  • 2.3 音频信号的特征分析
  • 2.4 音频的自动分类及相关特征分析
  • 2.5 音频分类实验结果及讨论
  • 3 哼唱乐曲检索和音频例子检索
  • 3.1 音频分类的使用及系统结构
  • 3.2 基于简单语义描述的哼唱乐曲检索
  • 3.3 基于改进的MFCC 特征表示的音频例子检索
  • 3.4 实验结果及讨论
  • 4 总结与展望
  • 4.1 全文总结
  • 4.2 展望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].音频娱乐的最大市场在哪里[J]. 上海广播电视研究 2019(03)
    • [2].用户思维与数据思维驱动优质音频创作[J]. 青年记者 2019(36)
    • [3].智媒时代的音频产业:盈利模式与路径创新[J]. 现代视听 2019(11)
    • [4].融合思维下音频媒体的智能化转向探究[J]. 传媒论坛 2020(03)
    • [5].多通道音频采集前端硬件设计[J]. 科技创新与应用 2020(08)
    • [6].在线音频平台内容付费市场分析[J]. 新闻战线 2019(24)
    • [7].机构媒体音频化发展背景下的人才变革[J]. 南方传媒研究 2019(06)
    • [8].付费音频平台的发展瓶颈与营销策略[J]. 青年记者 2019(33)
    • [9].用户体验视角下的音频知识付费平台主要缺陷与应对策略研究[J]. 声屏世界 2020(04)
    • [10].短音频会成为传统广播的新风口吗?[J]. 视听 2020(06)
    • [11].广播电台音频网的安装与维护[J]. 科技传播 2020(13)
    • [12].音频新闻:脉络、演进与特征[J]. 青年记者 2020(19)
    • [13].基于音频指纹的广播电台内容监测识别技术[J]. 西部广播电视 2020(17)
    • [14].中国移动音频平台营销策略及其启示[J]. 中国传媒科技 2020(08)
    • [15].移动互联网音频平台主持人特色[J]. 戏剧之家 2019(12)
    • [16].付费模式对音频出版的助力研究[J]. 传播力研究 2019(13)
    • [17].“新科技”元年:围绕用户发力声音价值[J]. 声屏世界·广告人 2017(02)
    • [18].基于云架构的音频采录拆条系统的设计与实现[J]. 电声技术 2017(03)
    • [19].基于凝聚信息瓶颈的音频事件聚类方法[J]. 电子学报 2017(05)
    • [20].张弛有度——如何把控音频节目节奏[J]. 影视制作 2017(03)
    • [21].录音设备安装与调试中音频干扰的来源与消除[J]. 电子世界 2017(18)
    • [22].生活中的科技[J]. 初中生 2019(Z6)
    • [23].《音频的编辑》教学设计[J]. 中国信息技术教育 2020(18)
    • [24].浅谈广播音频与互联网移动音频的融合发展[J]. 信息记录材料 2020(10)
    • [25].《音频基础》课程的设计与教学[J]. 中国文艺家 2020(10)
    • [26].基于倒谱分析的实时广播音频相似度快速比对算法[J]. 工程科学与技术 2020(03)
    • [27].基于球谐域三维音频直播系统的实现[J]. 电声技术 2020(04)
    • [28].浅析音频节目可视化的机遇与挑战——以《朋友请听好》为例[J]. 传播力研究 2020(07)
    • [29].基于压缩感知和音频指纹的固定音频检索方法[J]. 计算机系统应用 2020(08)
    • [30].论标准技术流程里的艺术呈现——里约奥运乒乓球音频公共信号制作[J]. 现代电视技术 2017(03)

    标签:;  ;  ;  ;  

    基于内容的音频检索研究
    下载Doc文档

    猜你喜欢