智能检索技术在媒体资产管理系统中的研究与实现

智能检索技术在媒体资产管理系统中的研究与实现

论文摘要

随着数字存储技术和多媒体技术的发展,对海量的音视频资料进行存储、管理、检索和再利用成了摆在人们面前一个严峻的课题。媒体资产管理系统中的智能化检索技术克服了传统文本检索的缺陷,成为当前的一个研究热点。本文从媒体资产管理系统对智能化检索的要求出发,系统的研究了数字图像底层特征提取、视频镜头切割、关键帧提取、视频场景合成(视频镜头聚类)以及基于模糊集的模糊聚类分析等方面的内容。对于视频镜头切割,本文采用了基于全局的直方图的方法。在视频镜头分割的基础上,需要对镜头抽取关键帧来表征视频镜头。常见的关键帧的选取算法,有的选取的关键帧的数目固定,不能完全反映视频镜头内容的变化;有的则存在关键帧选取过多的缺点。本文利用信息论中熵的含义,设计了一种基于图像灰度熵的关键帧提取算法,试验证明该算法能够克服传统的基于内容分析的关键帧提取算法中存在的关键帧提取过多的缺点,同时又能根据镜头内容的变化保留合适数目的关键帧。关键帧仅仅反映了一个镜头的内容。单个的视频镜头往往不能完备的反映视频的语义信息,因此需要在视频镜头的基础上合成更高层次的视频单元,从而建立以场景为单位的语义表示级视频结构。本文研究了常见的聚类算法,同时利用模糊数学为理论工具,设计了一种基于模糊聚类的视频语义分析算法,该算法能够提供不同精度的聚类输出。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 引言
  • 1.2 传统检索方法在媒体资产管理系统中的应用
  • 1.2.1 传统检索方法简介
  • 1.2.2 传统检索方法的局限性
  • 1.3 智能检索技术在媒体资产管理系统中的应用
  • 1.3.1 媒体资产管理系统中智能检索技术的定义
  • 1.3.2 国内外各系统的应用现状
  • 1.4 本文的主要研究工作
  • 1.5 本文组织结构
  • 第2章 视频结构分析
  • 2.1 视频定义
  • 2.2 数字视频压缩
  • 2.2.1 视频结构描述
  • 2.2.2 视频压缩的方式
  • 2.3 MPEG 视频数据格式定义
  • 2.3.1 MPEG 简介
  • 2.3.2 MPEG 视频结构描述
  • 2.3.3 MPEG 帧图像的类型
  • 2.3.4 MPEG 帧内编码
  • 2.3.5 MPEG 帧间编码
  • 2.3.6 MPEG 运动补偿预测
  • 第3章 视频镜头检测及关键帧的抽取
  • 3.1 视频镜头变换的类别
  • 3.2 视频镜头检测方法
  • 3.2.1 非压缩域的镜头检测方法
  • 3.2.2 压缩域的镜头检测方法
  • 3.3 关键帧的提取
  • 3.3.1 关键帧提取简介
  • 3.3.2 关键帧提取的常用方法
  • 3.4 一种基于图像灰度熵的关键帧提取算法
  • 3.4.1 图像灰度熵的定义
  • 3.4.2 算法描述
  • 3.4.3 试验结果
  • 第4章 视频镜头聚类与视频语义分析
  • 4.1 视频镜头聚类及视频语义分析的定义
  • 4.2 常用聚类算法分析
  • 4.2.1 划分的方法
  • 4.2.2 层次的方法
  • 4.2.3 基于密度的方法
  • 4.2.4 基于网格的方法
  • 4.2.5 基于模型的方法
  • 4.3 模糊集及模糊聚类
  • 4.3.1 模糊聚类的概念
  • 4.3.2 模糊聚类分析技术的应用
  • 4.4 模糊集的基本知识
  • 4.4.1 模糊集的相关定义
  • 4.4.2 模糊集的运算
  • 4.4.3 模糊集的相关定理
  • 4.5 模糊聚类算法
  • 4.5.1 谱系聚类方法
  • 4.5.2 基于等价关系的聚类方法
  • 4.5.3 基于图论的聚类方法
  • 4.5.4 基于目标函数的聚类方法
  • 4.6 一种基于模糊聚类的视频语义分析技术
  • 4.6.1 算法描述
  • 4.6.2 试验结果
  • 第5章 系统设计与实现
  • 5.1 系统架构
  • 5.2 试验环境
  • 5.3 系统模块及功能介绍
  • 第6章 总结与展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间取得的科研成果
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    智能检索技术在媒体资产管理系统中的研究与实现
    下载Doc文档

    猜你喜欢