论文摘要
文本是视频中重要的内容信息。视频中文本的检测和识别在视频分析过程中起到很大的作用。文本可以作为视频片断的内容标识和索引,例如在新闻视频中出现的新闻摘要,可以作为该段新闻内容的描述,用于新闻视频资料的检索。所以对视频文字的检测和分析是视频分析的重要内容。而检测视频中文字的出现及其准确位置,并将文字从复杂多变的背景中分割出来,是视频文字分析处理的基础。文本信息提取系统主要包括文本检测,文本定位,文本跟踪,文本提取,文本增强和OCR识别六个部分。本文重点研究了文本定位的方法,提出了一种基于投影分析与支持向量机学习相结合的文本定位方法,试验表明该方法比单纯的基于边缘的方法或是学习的方法都要好。首先采用投影分析的方法将可能的文本区域提取出来,然后再采用基于支持向量机学习的方法将提取出来的文本区域中的虚假文本区域排除掉。该方法虽然比基于边缘的方法多了一步,但文本区域的检准率有了较大的提高。与一般的基于学习的方法相比,该方法不必对整个图像区域进行特征计算,减小了计算的时间复杂度。在使用支持向量机进行文本分类时本文采用了小波,角点,扫描线和区域内边缘点的重心位置等特征。论文最后用该方法用于广告视频文本的检测,采用基于多分辨率分析的方法定位广告文本。通过比较发现,新闻中的文本出现位置比较固定而且各个电视台的文本都有各自固定的格式,但广告中的文本无论是大小,字体都是不一样的,利用这一差别可以对广告片断的起始位置有一个更加精确的定位。实验结果表明该方法可以很好的定位出广告文本。
论文目录
摘要Abstract第一章 绪论1.1 引言1.2 视频文本提取技术的研究意义和目的1.3 视频中文本的分类1.4 视频中文本的特点1.5 视频中文本提取的难点1.6 文本信息提取系统的组成1.7 本文的主要内容和章节安排1.7.1 本文的主要研究内容1.7.2 本文的章节安排第二章 相关研究综述2.1 基于区域的文本定位方法2.1.1 基于连通分量的文本定位方法2.1.2 基于边缘的文本定位方法2.2 基于纹理的文本定位方法2.3 基于学习的文本定位方法2.4 压缩域的文本定位方法2.5 基于时空分布特征的文本定位方法2.6 文本定位总结2.7 本章小结第三章 基于投影分析与支持向量机分类的文本定位方法3.1 引言3.2 基于边缘特征多次投影分析的文本定位3.2.1 图像预处理3.2.2 多次投影分析的文本定位算法3.2.3 非文本区域的滤除3.2.4 实验结果及分析3.3 基于支持向量机学习的文本定位3.3.1 支持向量机原理3.3.2 文本区域特征的选择3.4 实验结果及分析3.5 本章小结第四章 基于多分辨率的广告视频文本定位4.1 引言4.2 新闻和广告视频的特征4.2.1 视频的一般特征4.2.2 新闻视频和广告视频的比较4.2.3 新闻和广告视频中文本的特征4.3 广告视频中的文本定位与提取4.3.1 图像预处理4.3.2 基于多分辨率的广告文本定位与提取4.4 实验结果及分析4.5 基于文本特征的新闻视频广告探测4.6 本章小结第五章 总结和展望5.1 本文总结5.2 进一步研究展望参考文献致谢
相关论文文献
标签:视频检索论文; 视频文本定位论文; 投影论文; 支持向量机论文; 广告视频探测论文;