论文摘要
随着数字媒体库的日益增加,有效的索引和检索多媒体信息的需求也日益增长,基于内容的多媒体检索成为目前研究的热点。如果能将镶嵌在数字图像中的文本信息准确地提取出来并加以识别,对于图像和视频等多媒体信息内容的分析、理解和基于内容的检索具有重要的意义;另一方面现有的技术也为图像的文本信息提取提供了较成熟的技术基础。因此如何迅速、准确地提取图像中的文本信息为字符识别系统提供输入成为近年来人们研究的重点。由于图像中的文字可能以不同的语种、字体、大小存在,而且背景图像非常复杂,这给图像的文本信息提取带来了很大的困难。本文的研究目的就是要快速、准确地从图像中定位文本区域,并将文本区域二值化,将文本信息以单字的形式提供给字符识别系统进行后期的处理和识别。由于小波变换具有良好的时频特性与多分辨分析的特点,因此,利用小波变换进行图像的文本信息提取已经成为当前文本提取的研究热点和重要的研究方向。本文研究了基于小波变换的图像文本信息提取模型,提出了一种在小波域内提取图像文本信息的算法,该算法首先对图像进行二维小波变换,设置滑动窗扫描高频子带,计算滑动窗内图像的小波纹理特征,采用k-均值聚类算法提取文本区域,对文本区域进行形态运算,再对原图像进行边缘检测,根据文本区域的相关特征精确地定位文本区域,最后将文字与背景分离。从实验结果可以看出该算法能够较准确的从背景图像中提取出不同语种、字体、大小的文本信息。
论文目录
摘要Abstract第1章 绪论1.1 课题研究意义1.2 课题研究背景1.2.1 背景图像中文本信息的分类1.2.2 文本信息提取技术概述1.2.3 小波分析在图像文本信息提取中的应用1.3 课题研究目的1.4 论文的内容及结构第2章 小波变换与多分辨分析2.1 小波变换2.1.1 连续小波变换2.1.2 二进小波变换2.1.3 离散小波变换2.2 多分辨分析2.3 Mallat分解与重构算法2.3.1 正交小波分解与重构2.3.2 双正交小波分解与重构2.3.3 二维小波分解与重构2.4 本章小结第3章 小波基的构造3.1 小波基的性质3.1.1 消失矩3.1.2 正则性3.1.3 紧支性和对称性3.1.4 正交性和双正交性3.2 紧支撑正交小波的构造3.3 紧支撑双正交小波的构造3.4 常用小波基3.4.1 Haar小波3.4.2 B-样条小波3.4.3 Daubechies紧支正交小波3.5 本章小结第4章 文本信息提取相关知识介绍4.1 纹理特征分析4.2 聚类分析4.3 数学形态学4.3.1 二值腐蚀和膨胀4.3.2 二值开闭运算4.4 边缘检测4.4.1 微分边缘检测算子4.4.2 多尺度边缘检测4.5 本章小结第5章 小波域内图像的文本提取算法研究5.1 小波分析在图像文本信息提取领域的应用现状5.2 基于二维小波分解的背景图像文本信息提取算法5.2.1 图像小波变换5.2.2 图像区域分类5.2.3 边缘检测5.2.4 文本区域定位5.2.5 文本区域二值化5.3 仿真试验结果5.4 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:小波变换论文; 文本提取论文; 均值聚类算法论文; 纹理特征论文; 边缘检测论文;