论文摘要
随着数字存储技术和多媒体技术的发展,对海量的音视频资料进行存储、管理、检索和再利用成了摆在人们面前一个严峻的课题。媒体资产管理系统中的智能化检索技术克服了传统文本检索的缺陷,成为当前的一个研究热点。本文从媒体资产管理系统对智能化检索的要求出发,系统的研究了数字图像底层特征提取、视频镜头切割、关键帧提取、视频场景合成(视频镜头聚类)以及基于模糊集的模糊聚类分析等方面的内容。对于视频镜头切割,本文采用了基于全局的直方图的方法。在视频镜头分割的基础上,需要对镜头抽取关键帧来表征视频镜头。常见的关键帧的选取算法,有的选取的关键帧的数目固定,不能完全反映视频镜头内容的变化;有的则存在关键帧选取过多的缺点。本文利用信息论中熵的含义,设计了一种基于图像灰度熵的关键帧提取算法,试验证明该算法能够克服传统的基于内容分析的关键帧提取算法中存在的关键帧提取过多的缺点,同时又能根据镜头内容的变化保留合适数目的关键帧。关键帧仅仅反映了一个镜头的内容。单个的视频镜头往往不能完备的反映视频的语义信息,因此需要在视频镜头的基础上合成更高层次的视频单元,从而建立以场景为单位的语义表示级视频结构。本文研究了常见的聚类算法,同时利用模糊数学为理论工具,设计了一种基于模糊聚类的视频语义分析算法,该算法能够提供不同精度的聚类输出。
论文目录
摘要ABSTRACT第1章 绪论1.1 引言1.2 传统检索方法在媒体资产管理系统中的应用1.2.1 传统检索方法简介1.2.2 传统检索方法的局限性1.3 智能检索技术在媒体资产管理系统中的应用1.3.1 媒体资产管理系统中智能检索技术的定义1.3.2 国内外各系统的应用现状1.4 本文的主要研究工作1.5 本文组织结构第2章 视频结构分析2.1 视频定义2.2 数字视频压缩2.2.1 视频结构描述2.2.2 视频压缩的方式2.3 MPEG 视频数据格式定义2.3.1 MPEG 简介2.3.2 MPEG 视频结构描述2.3.3 MPEG 帧图像的类型2.3.4 MPEG 帧内编码2.3.5 MPEG 帧间编码2.3.6 MPEG 运动补偿预测第3章 视频镜头检测及关键帧的抽取3.1 视频镜头变换的类别3.2 视频镜头检测方法3.2.1 非压缩域的镜头检测方法3.2.2 压缩域的镜头检测方法3.3 关键帧的提取3.3.1 关键帧提取简介3.3.2 关键帧提取的常用方法3.4 一种基于图像灰度熵的关键帧提取算法3.4.1 图像灰度熵的定义3.4.2 算法描述3.4.3 试验结果第4章 视频镜头聚类与视频语义分析4.1 视频镜头聚类及视频语义分析的定义4.2 常用聚类算法分析4.2.1 划分的方法4.2.2 层次的方法4.2.3 基于密度的方法4.2.4 基于网格的方法4.2.5 基于模型的方法4.3 模糊集及模糊聚类4.3.1 模糊聚类的概念4.3.2 模糊聚类分析技术的应用4.4 模糊集的基本知识4.4.1 模糊集的相关定义4.4.2 模糊集的运算4.4.3 模糊集的相关定理4.5 模糊聚类算法4.5.1 谱系聚类方法4.5.2 基于等价关系的聚类方法4.5.3 基于图论的聚类方法4.5.4 基于目标函数的聚类方法4.6 一种基于模糊聚类的视频语义分析技术4.6.1 算法描述4.6.2 试验结果第5章 系统设计与实现5.1 系统架构5.2 试验环境5.3 系统模块及功能介绍第6章 总结与展望参考文献致谢攻读硕士学位期间取得的科研成果
相关论文文献
标签:媒体资产管理论文; 智能检索论文; 视频镜头分割论文; 关键帧论文; 模糊聚类论文;