论文摘要
图像或视频的抽象研究,是近年来非真实感绘制研究的一个热点之一,在远程教育培训、娱乐、机器学习和识别等领域有非常重要的应用。与真实的图像和视频不同,图像或视频的抽象研究如何根据人的意愿有效地传达特定信息,舍弃不必要的细节,根据表现意图突出强调有意义的部分。同时,经过抽象的视频在存储容量和传输速度上比真实的视频图像有很大的优势。在图像抽象方面,前人利用眼动跟踪设备实现了基于关注的图像的多层次绘制,即根据图像中的内容对观察者的重要程度,对不同区域生成不同层次的抽象,对特别关注的位置,用丰富的颜色和明显的线条进行表示,其余部分则绘制的比较简略,只保留大致特征。在视频抽象方面,已有工作主要研究动画风格视频的自动生成,主要有基于视频序列的绘制方法,如光流场、目标跟踪和能量函数最小化方法等,和基于三维模型的风格动画绘制方法。但这些方法大多是研究如何保持生成动画的帧间连贯性,并未体现出对同一帧画面进行多层次抽象的思想,在很多应用领域,如远程教育培训、机器学习和识别等,需要根据视频或图像中景物的重要程度进行不同层次的抽象,从而体现人们对某种事物的关注。本文工作主要研究图像和视频的多层次抽象。首先将图像与视频进行多层次特征抽取,生成图像金字塔,并对各个层次进行区域分割,对区域填充以各异的颜色,建立区域层次结构,作为多层次绘制的中间表示,然后根据用户感兴趣的位置,在粗略地绘制整个画面的基础上,进行更细致的绘制,达到多层次的绘制的目的,从而生成一种多层次的抽象风格。在已有的图像抽象方法基础上,本文对动态浏览图像和视频的连贯性绘制分别进行了研究。本文主要研究内容和贡献有以下两个方面:1.提出了一种对图像进行动态抽象绘制的方法,适用于浏览图像时注视点发生移动的情况。相比于以往的研究,本文从人眼的感知特性出发,考虑了与用户的眼动交互。随着用户随处浏览图像时关注位置的变化,细节层次分布发生相应的改变,生成动态变化的图像帧,并用一系列的手段控制画面连贯性。2.提出了一种基于关注程度的视频抽象绘制方法。本文的方法是,利用各向异性核函数的Mean Shift分割算法对视频整体进行多层次的特征抽取,再从视觉感知模型入手,研究动态画面中用户关注程度与抽象层次的关系,生成类似卡通风格的视频序列,既保持视频流的连贯性,又使抽象层次随内容的重要程度而变化。文章最后通过实例证明了本文方法增强了时间和空间的连贯性,改善了视觉效果。基于本文的工作,还可以对其他风格的视频多层次抽象作进一步的研究,以及探索如何处理更复杂的视频序列,例如运动模糊、淡入淡出等。