视频中的文本提取及其应用

论文摘要

文本是视频中重要的内容信息。视频中文本的检测和识别在视频分析过程中起到很大的作用。文本可以作为视频片断的内容标识和索引，例如在新闻视频中出现的新闻摘要，可以作为该段新闻内容的描述，用于新闻视频资料的检索。所以对视频文字的检测和分析是视频分析的重要内容。而检测视频中文字的出现及其准确位置，并将文字从复杂多变的背景中分割出来，是视频文字分析处理的基础。文本信息提取系统主要包括文本检测，文本定位，文本跟踪，文本提取，文本增强和OCR识别六个部分。本文重点研究了文本定位的方法，提出了一种基于投影分析与支持向量机学习相结合的文本定位方法，试验表明该方法比单纯的基于边缘的方法或是学习的方法都要好。首先采用投影分析的方法将可能的文本区域提取出来，然后再采用基于支持向量机学习的方法将提取出来的文本区域中的虚假文本区域排除掉。该方法虽然比基于边缘的方法多了一步，但文本区域的检准率有了较大的提高。与一般的基于学习的方法相比，该方法不必对整个图像区域进行特征计算，减小了计算的时间复杂度。在使用支持向量机进行文本分类时本文采用了小波，角点，扫描线和区域内边缘点的重心位置等特征。论文最后用该方法用于广告视频文本的检测，采用基于多分辨率分析的方法定位广告文本。通过比较发现，新闻中的文本出现位置比较固定而且各个电视台的文本都有各自固定的格式，但广告中的文本无论是大小，字体都是不一样的，利用这一差别可以对广告片断的起始位置有一个更加精确的定位。实验结果表明该方法可以很好的定位出广告文本。

论文目录

摘要

Abstract

第一章绪论

1.1 引言

1.2 视频文本提取技术的研究意义和目的

1.3 视频中文本的分类

1.4 视频中文本的特点

1.5 视频中文本提取的难点

1.6 文本信息提取系统的组成

1.7 本文的主要内容和章节安排

1.7.1 本文的主要研究内容

1.7.2 本文的章节安排

第二章相关研究综述

2.1 基于区域的文本定位方法

2.1.1 基于连通分量的文本定位方法

2.1.2 基于边缘的文本定位方法

2.2 基于纹理的文本定位方法

2.3 基于学习的文本定位方法

2.4 压缩域的文本定位方法

2.5 基于时空分布特征的文本定位方法

2.6 文本定位总结

2.7 本章小结

第三章基于投影分析与支持向量机分类的文本定位方法

3.1 引言

3.2 基于边缘特征多次投影分析的文本定位

3.2.1 图像预处理

3.2.2 多次投影分析的文本定位算法

3.2.3 非文本区域的滤除

3.2.4 实验结果及分析

3.3 基于支持向量机学习的文本定位

3.3.1 支持向量机原理

3.3.2 文本区域特征的选择

3.4 实验结果及分析

3.5 本章小结

第四章基于多分辨率的广告视频文本定位

4.1 引言

4.2 新闻和广告视频的特征

4.2.1 视频的一般特征

4.2.2 新闻视频和广告视频的比较

4.2.3 新闻和广告视频中文本的特征

4.3 广告视频中的文本定位与提取

4.3.1 图像预处理

4.3.2 基于多分辨率的广告文本定位与提取

4.4 实验结果及分析

4.5 基于文本特征的新闻视频广告探测

4.6 本章小结

第五章总结和展望

5.1 本文总结

5.2 进一步研究展望

参考文献

致谢

视频中的文本提取及其应用

论文摘要

论文目录

相关论文文献

猜你喜欢