音频片段论文-邱旻翔

音频片段论文-邱旻翔

导读:本文包含了音频片段论文开题报告文献综述及选题提纲参考文献,主要关键词:音频检索,Java,特征提取,层次SVM

音频片段论文文献综述

邱旻翔[1](2017)在《一种音频片段检索系统的Java实现》一文中研究指出音频检索作为获取信息的重要手段之一,如何快速准确地从海量音频片段中获取所需内容成为音频检索发展的主要瓶颈。音频指纹技术的引入有效地解决了海量音频数据存储的容量问题,但在音频相似度上只能做到模糊匹配。因此,为了解决海量音频数据检索的精度与速度的矛盾,本文主要研究了音频特征的提取,设计了一种基于层次SVM多分类及模糊聚类的音频片段检索方法,并采用Java语言实现音频片段检索原型系统。本文设计实现的基于特征相似度的音频片段检索原型系统,实现了高速、有效的音频片段检索,具有良好的扩展性。本文实现在普通配置服务器设备存储的大规模音频样例数据源中,对未知信息音频片段进行相似音频检索,在保证检索准确率良好的同时,缩减了检索时间。论文实现的音频片段检索原型系统是一个实验性的检索平台,本文进行了大量的性能测试验证了其可用性和可靠性。本文首先探讨了音频特征向量的构成。其次通过对目前常用的音频分类方法作比较,设计了一种修正后的层次SVM多分类方法,将分类精度提高到90%以上,并能保持在实际应用中对未知数据的分类正确率。采用音频分类技术的目的是压缩检索范围,减少音频比对次数,以缩减检索时间。然后本文探讨了音频片段相似度的计算方法,实现了基于模糊聚类的一种音频片段检索系统。模糊聚类将单个音频片段庞大的特征数据矩阵聚类形成K个质心,使用这K个质心表征音频片段大幅缩减了音频特征数据复杂度,减少了音频相似度比对时间。最后根据测试结果对音频片段检索系统的发展进行了展望。(本文来源于《东南大学》期刊2017-02-28)

余春艳,翁子林[2](2015)在《音频情感感知与视频精彩片段提取》一文中研究指出为了将伴生音频数据的情感语义用于引导视频精彩片段的提取,提出一种音频感知驱动下的视频精彩片段提取方法.为提取伴生音频数据的情感语义,使用一个基于分层二叉树支持向量机的音频分类器提取中层音频类型,并集成了一个情感映射模型以感知高层情感语义;然后利用该前置音频情感感知模型实现伴生音频情感语义的波动分析,并进一步以精彩片段起止定位策略和音视频同步修订为辅助手段,实现视频精彩片段的定位.文中方法以音频数据情感语义波动序列为核心枢纽,以两阶段音频情感感知模型为前导分析,构建了一个完整的音频情感驱动下视频精彩片段提取架构.实验结果表明,在保证一定查准率的情况下,音频情感驱动下的视频精彩片段提取具有较好的通用性,较高的查全率以及完整度.(本文来源于《计算机辅助设计与图形学学报》期刊2015年10期)

吴海霞,李艳玲,刘潞锋[3](2015)在《基于内容和旋律的音频片段识别与检索》一文中研究指出介绍了音频信号的主要特征和处理技术,给出音频检索系统的处理框架和主流产品,并列出典型检索引擎及应用行业;详细阐述了音频识别和检索的主要方法、基于旋律和内容的音频片段检索的原理和特点;最后结合实验和测试中的实际问题对音频检索进行展望.(本文来源于《太原师范学院学报(自然科学版)》期刊2015年02期)

梁家欣[4](2015)在《基于张量模型的暴力音频片段检测方法研究》一文中研究指出随着互联网的发展,人们越来越易于在网络上分享多媒体,则不可避免地会有一些暴力多媒体信息流入网络,对于未成年等特定人群来说,这些信息会对他们的行为习惯产生严重的负面影响。仅依靠人工审核的效率十分非常低下,需要一种方法可以自动检测出暴力内容并阻止其传播。听觉是人们获取多媒体信息的重要途径,现有的暴力多媒体检测研究中,听觉通道常常作为视听觉通道融合的辅助途径而没有得到人们的重视,对音频特征的处理比较简单,没有充分利用特征信息,识别效果受到了一定的限制,这也会进一步影响视频的检测效果,因此本文主要研究了音频通道的多媒体暴力内容的检测方法。本文主要研究了基于张量模型的暴力音频的检测方法。首先选出对暴力声响具有较强区分度的特征集,以一个类别为单位构造出该类别的特征张量。然后,对每一个类别的特征张量进行分解、计算,构造出一个该类别的投影子空间,这个子空间可以把样本的原始特征矩阵投影为一个低维特征向量,这样,就可以将高维特征变换为低维信息且保留了内在结构信息。最后,针对所提取的特征提出了一种基于最小风险贝叶斯准则的暴力音频分类方法,先对不同类别的音频特征分别建立高斯模型,再根据最小风险贝叶斯准则得到最后的预测类别。本文所使用的数据集来自Media Eval 2013 Workshop所提供的数据库中的部分音频,实验结果表明,与统计值特征相比,使用张量模型的特征的召回率有很大提高,精确度相对较低,但综合来看F1有了一定的提高。为了进一步提高识别效果,弥补精确度较低的缺点,提出了一种对长短时特征信息融合的方法,实验结果在精确度上有很大提高,且与传统方法相比,召回率,精确度和F1均有一定的提高。(本文来源于《哈尔滨工业大学》期刊2015-06-01)

陈世娇,甘涛,周桢[5](2013)在《一种改进的音频点播系统BT片段下载算法》一文中研究指出在基于BT协议片段选择算法的基础上,提出了一种分区域多线程片段下载算法,解决了音频点播系统实时播放的问题。该算法通过对文件片段进行区域划分,针对不同区域的片段按照其播放的紧急性采用不同的下载算法,能够有效地减小音频点播的启动延迟、提高音频播放的流畅性,经验证系统的稳定性以及下载速度均得到了很大的改善。(本文来源于《电子设计工程》期刊2013年17期)

李祺,徐国爱,田斌,张淼[6](2011)在《基于云的多媒体服务平台中音频关键片段检测方法(英文)》一文中研究指出With the development of cloud-based data centers and multimedia technologies, cloud-based multimedia service systems have been paid more and more attention. Audio highlights detection plays an important role in the cloud-based multimedia service system. In this paper, we proposed a novel highlight detection method to extract the audio highlight effects for the cloud-based multimedia service system using the unsupervised approach. In the proposed method, we first extract the audio features for each audio document. Then the spectral clustering scheme was used to decompose the audio document into several audio effects. Then, we introduce the TF-IDF method to label the highlight effect. We design some experiments to evaluate the performance of the proposed method, and the experimental results show that our method can achieve satisfying results.(本文来源于《中国通信》期刊2011年06期)

曹红霞[7](2010)在《从需求出发学习技术,应用技术解决问题——《音频作品创作》教学片段与反思》一文中研究指出题记:信息技术教学的经验越来越多,这是好事,因为多了才有积淀,多了才有筛选,多了才有超越——但是,不论教学设计多么妙笔生花,我们必须要回归课堂的效益,回归课堂的价值取向,回归课堂的(本文来源于《中国信息技术教育》期刊2010年17期)

唐秀林[8](2007)在《Nuendo音频片段的编辑》一文中研究指出Nuendo是计算机音频工作站的全功能型软件,运行于Windows98,2000,NT,XP或OSX系统均可,音频处理也无需其他外设。半成品音乐能在不同的计(本文来源于《音响技术》期刊2007年08期)

音频片段论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了将伴生音频数据的情感语义用于引导视频精彩片段的提取,提出一种音频感知驱动下的视频精彩片段提取方法.为提取伴生音频数据的情感语义,使用一个基于分层二叉树支持向量机的音频分类器提取中层音频类型,并集成了一个情感映射模型以感知高层情感语义;然后利用该前置音频情感感知模型实现伴生音频情感语义的波动分析,并进一步以精彩片段起止定位策略和音视频同步修订为辅助手段,实现视频精彩片段的定位.文中方法以音频数据情感语义波动序列为核心枢纽,以两阶段音频情感感知模型为前导分析,构建了一个完整的音频情感驱动下视频精彩片段提取架构.实验结果表明,在保证一定查准率的情况下,音频情感驱动下的视频精彩片段提取具有较好的通用性,较高的查全率以及完整度.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

音频片段论文参考文献

[1].邱旻翔.一种音频片段检索系统的Java实现[D].东南大学.2017

[2].余春艳,翁子林.音频情感感知与视频精彩片段提取[J].计算机辅助设计与图形学学报.2015

[3].吴海霞,李艳玲,刘潞锋.基于内容和旋律的音频片段识别与检索[J].太原师范学院学报(自然科学版).2015

[4].梁家欣.基于张量模型的暴力音频片段检测方法研究[D].哈尔滨工业大学.2015

[5].陈世娇,甘涛,周桢.一种改进的音频点播系统BT片段下载算法[J].电子设计工程.2013

[6].李祺,徐国爱,田斌,张淼.基于云的多媒体服务平台中音频关键片段检测方法(英文)[J].中国通信.2011

[7].曹红霞.从需求出发学习技术,应用技术解决问题——《音频作品创作》教学片段与反思[J].中国信息技术教育.2010

[8].唐秀林.Nuendo音频片段的编辑[J].音响技术.2007

标签:;  ;  ;  ;  

音频片段论文-邱旻翔
下载Doc文档

猜你喜欢