论文题目: 网络电视中的关键技术研究
论文类型: 博士论文
论文专业: 计算机应用技术
作者: 肖友能
导师: 薛向阳
关键词: 多媒体技术,视频内容分析,视频流化,镜头边界检测,运动分析,视频可扩展编码,错误隐藏,视频转码,速率控制
文献来源: 复旦大学
发表年度: 2005
论文摘要: 随着Internet普及和数字音视频技术发展,出现了许多新的网上服务,例如网络电视、网络游戏、网上求医和网络教育等。可以预见,传统电视将很快被网络电视所取代,人们收看电视将从传统被动接收频道(即直播应用,或PUSH应用)转变为主动选择内容(即点播应用,或PUSH应用)。为了适应用户需求和应用模式的变化,在网络电视领域,就需要研究音视频流化、可靠组播、音视频内容的结构化分析、基于内容的音视频信息检索等技术。 本论文以网络电视的两种基本应用方式—直播应用和点播应用为主线,研究了网络电视所涉及的若干关键技术。本文在研究视频内容的结构化分析,视频流化传输的基础上,对其中的一些关键技术,如:镜头边界检测、视频流中的运动分析、视频可扩展编码、错误隐藏、视频转码等问题做了深入研究,提出了一些新的思想和方法。具体内容包括: 1.提出了压缩域中叠化(Dissolve)镜头的快速检测算法:由于叠化镜头是发生镜头切换的两个相邻镜头在时间和空间上的融合,叠化镜头是各种类型的镜头切换中最难检测的一种。本文根据叠化镜头内部预测帧误差能量分布特点和运动矢量分布特点,采用滑动窗口方法,提出一种在压缩域中检测叠化镜头的新算法,它可以准确地定位出大部分叠化镜头。 2.提出了压缩视频流中主要运动的定性分析算法:根据运动矢量的分布特性、运动矢量之间的相对关系特性等,提出了一种压缩视频流中主要运动的定性分析算法。实验结果表明该算法具有速度快、精度高、鲁棒性好等特征,非常适合于视频信息检索方面的应用。 3.实现了基于频域的视频可扩展编码方法:将视频数据根据重要性划分成不同的层,分别用不同服务质量的信道传送是提高视频流化传输质量的一个有效方法。本文对MPEG-2标准推荐的频域可扩展编码方法一数据分割(Data Partition)方法进行了部分改进,减小了数据分割所带来的数据冗余,并给出了一个基本层和增强层数据同步的具体方法。 4.提出基于镜头边界检测的时空自适应错误隐藏算法:时域错误隐藏计算开销小,隐藏效果好,是常用的错误隐藏方法。但是在镜头的边界,时域错误隐藏会失效。本文提出一种新的错误隐藏算法,它利用视频解码器在解码过程中得到的副产品信息,判断当前发生错误的帧是否是镜头边界。如果当前帧是镜头边界,则使用空域错误隐藏方法;如果不是边界,则使用时域错误隐藏方法。试验结果证明,所提算法具有速度快,系统开销小、隐藏效果好等优点,非常适合于
论文目录:
摘要
ABSTRACT
第一章 前言
1.1 网络时代视频处理技术的发展与研究现状
1.2 论文的主要工作和组织结构
第二章 网络电视研究的现状
2.1 网络电视的诞生
2.2 视频的流化传输
2.2.1 视频的流化传输现状
2.2.2 视频流化传输的基本架构
2.2.3 视频的流化传输面临的问题
2.2.4 适应视频流化传输的视频编码技术
2.2.5 多媒体数据压缩标准—MPEG系列
2.3 基于内容的视频信息检索现状
2.3.1 视频信息检索的研究现状
2.3.2 多媒体内容描述接口—MPEG-7
2.4 本章小结
第三章 视频镜头边界检测算法研究
3.1 镜头切换的定义
3.2 镜头边界检测的几种基本算法
3.3 压缩域中叠化镜头的快速检测算法
3.3.1 算法原理
3.3.2 实验结果
3.4 本章小结
第四章 视频流中的运动分析算法
4.1 视频中运动信息的特点
4.2 视频中运动分析的几种基本方法
4.2.1 光流估算法
4.2.2 运动矢量估算法
4.2.3 基于直方图的统计分析方法
4.2.4 参数化的全局运动分析法
4.3 压缩视频流中主要运动的定性分析
4.3.1 相机运动与运动矢量场的关系
4.3.2 算法原理
4.3.3 实验结果
4.4 本章小结
第五章 基于频域的视频可扩展编码方法
5.1 视频可扩展编码研究的意义
5.2 MPEG-2标准对可扩展编码的支持
5.3 基于频域的视频可扩展编码方法
5.3.1 电视台端的数据分级
5.3.2 电视机端的数据重组
5.3.3 试验分析
5.4 本章小结
第六章 基于内容的时空自适应错误隐藏算法
6.1 视频解码对传输错误的脆弱性
6.2 几种基本的错误隐藏方法
6.2.1 前向错误隐藏
6.2.2 通过后处理的错误隐藏
6.2.3 解码器和编码器交互的错误隐藏
6.3 基于镜头边界检测时空自适应错误隐藏算法
6.3.1 错误发现机制
6.3.2 空域上的错误隐藏
6.3.3 时域上的错误隐藏
6.3.4 压缩域中快速镜头分割方法
6.3.5 试验分析
6.4 本章小结
第七章 视频转码技术的回顾及转码速率控制研究
7.1 视频转码的典型应用
7.1.1 客户—转码代理—服务器类型
7.1.2 一点对多点类型
7.1.3 视频会议类型
7.2 视频转码系统的典型体系结构
7.2.1 基于像素域的级连式体系结构
7.2.2 基于像素域的快速级连转码体系结构
7.2.3 基于DCT域的转码体系结构
7.3 MPEG-2到H.264/AVC转码速率控制的有效算法
7.3.1 预备知识
7.3.2 算法原理
7.3.3 试验分析
7.4 本章小结
第八章 网络电视系统的设计与实现
8.1 网络电视的体系结构
8.2 基于内容的数据电视节目浏览和检索系统
8.2.1 基于内容的数据电视节目浏览和检索系统的总体结构
8.2.2 系统硬件结构
8.2.3 系统软件结构
8.2.4 系统工作模式
8.3 INTERNET DTV/HDTV系统
8.3.1 Internet DTV/HDTV的硬件环境
8.3.2 Internet DTV/HDTV软件系统
8.4 本章小结
第九章 总结与展望
附录一 博士期间发表的论文
附录二 博士期间参加的科研项目
参考文献
致谢
发布时间: 2005-09-19
相关论文
- [1].数字电视的视频分析与组播传输[D]. 刘阳.中国科学院研究生院(软件研究所)2003
- [2].视频通信中的误码控制技术研究[D]. 李虓江.浙江大学2003
- [3].H.264/AVC中运动估计、变换与解码器优化[D]. 薛全.浙江大学2004
- [4].基于内容的视频运动对象分割技术研究[D]. 包红强.上海大学2005
- [5].H.264/AVC实时编码系统及其相关算法的研究[D]. 滕国伟.上海大学2005
- [6].面向3G的H.264/AVC压缩视频通信技术研究[D]. 柳林.浙江大学2006
- [7].视频运动对象分割与先进运动估计/运动补偿算法之研究[D]. 朱向军.浙江大学2006
- [8].基于AVS的数字电视系统及其相关技术研究[D]. 王国中.华东师范大学2006
标签:多媒体技术论文; 视频内容分析论文; 视频流化论文; 镜头边界检测论文; 运动分析论文; 视频可扩展编码论文; 错误隐藏论文; 视频转码论文; 速率控制论文;