基于内容的暴力视频检索

论文摘要

随着计算机、网络和多媒体技术的迅速发展,人们越来越多的接触到大量的视频信息。如何从包含大量信息的庞大视频库中检索出所需要的有用信息,已经是一个迫切需要解决的研究难题。目前,对视频信息的检索主要利用图像处理和人工智能等技术对视频实际内容进行分析和处理,即基于内容的视频检索（CBVR, Content-Based Video Retrieval）,该研究领域目前是图像处理的热门研究课题之一。基于内容的暴力视频检索广泛应用于视频分级、影视剪切及公共安全等领域。本文主要研究含有爆炸和枪击内容的暴力场景的视频检索与提取。首先对视频分割问题进行了研究。分析了视频数据的特点以及视频的结构。在对视频分割的典型算法进行系统研究后,主要实现了双阈值算法和基于直方图的模糊C-均值聚类算法（HBFCM）。并针对HBFCM算法提出了改进,不仅消除了溶图现象而且使信息熵小的关键帧大幅减少。实验结果表明,改进后的算法对视频分割的效果较好。其次对基于内容的图像检索技术进行了研究。分析了图像的低层特征（颜色、纹理、形状等）。实现了基于累加颜色直方图的图像检索算法,并对爆炸场景中的图像进行了检索。提出了一种基于局部自动颜色相关图的图像检索算法,并根据设计的火焰特征模板和浓烟特征模板对爆炸场景中的图像进行了检索。实验结果表明,基于局部自动颜色相关图的图像检索算法的查全率和准确率能同时达到约70%以上。最后对音频在检索暴力场景的应用进行了研究。分析了音频数据、音频帧和音频段的特征。针对利用图像特征难于有效检索到枪击场景的问题,设计了一种基于过零率和短时能量（ZCR-STE）的枪击场景检索算法,提出了一种新的音频段短时能量的计算方法。实验结果表明,基于ZCR-STE的算法能够较好地检索出枪击场景,同时提出的短时能量计算方法在查全率方面大大优于均值计算方法。

论文目录

致谢

中文摘要

ABSTRACT

1 引言

1.1 研究背景和意义

1.2 研究现状

1.3 论文组织安排

2 视频检索相关技术综述

2.1 视频检索的基本概念和基本框架

2.2 视频分割技术

2.2.1 镜头切换检测

2.2.2 聚类检测

2.3 图像特征

2.3.1 颜色特征

2.3.2 纹理特征

2.3.3 形状特征

2.4 其他相关知识

2.4.1 数字形态学

2.4.2 中值滤波器

2.5 实验平台

3 视频的分割

3.1 基于双闭值的镜头切换检测

3.2 基于直方图的模糊c一均值聚类算法（HBFCM）

3.3.1 特征提取阶段

3.3.2 聚类阶段

3.3.3 关键帧选取阶段

3.3.4 双阑值和HBFCM的比较

3.3.5 算法的改进

4 基于颜色特征的爆炸场景检索

4.1 累加直方图法

4.2 颜色相关图法

4.2.1 颜色空间的选择

4.2.2 复杂度分析

4.3 基于局部自动颜色相关图的爆炸场景检索算法

4.3.1 模板生成

4.3.2 特征选择

4.4 爆炸场景的检索实验

5 基于音频的枪击场景检索

5.1 音频基本概念

5.2 基于ZCR-STE的检索算法

5.3 枪击场景的检索实验

6 总结与展望

6.1 总结

6.2 展望

参考文献

作者简历

学位论文数据集

基于内容的暴力视频检索

论文摘要

论文目录

相关论文文献

猜你喜欢