数字图像中文字移除和修复系统的设计和实现

数字图像中文字移除和修复系统的设计和实现

论文摘要

随着计算机科学、多媒体技术的飞速发展,以数字图像为主的多媒体信息迅速成为重要的通用信息媒体。在数字图像中,文字信息(如新闻标题、旁白和广告词等等)包含了丰富的高层语义信息,自动提取出这些文字,首先对它们识别和分析,对于图像高层语义的索引和检索是非常有帮助的。此外,将提取出的文字从原图中去除,可修复被文字所遮挡的背景区域,使其恢复原来的面貌,甚至再添加上多语种的文字,这对于不同语种间的交流和图像的再次使用也是很有意义的。本文主要对于数字图像中文字的移除和修复系统的设计及实现,其工作体现在:(1)文字的移除。在已有图像文字提取算法进行研究的基础上,利用文字区域与图像背景之间存在着明显的边缘轮廓这一实际情况,提出了基于笔画过滤器、颜色极性判断和OCR模块反馈的文字区域提取算法。该算法运用笔画过滤器对文字进行初步提取,然后用灰度极性判断来增强文字提取的可靠性,最后靠OCR反馈来进一步提示文字提取的性能。实验结果证明,该算法非常有效,文字提取率高,且具有鲁棒性。(2)在提取出图像内的文字区域后,对原来文本遮挡的区域进行修复。基于TV模型的修复方法有较好的恢复效果,但对参数的选取比较敏感,且运算量较大等问题,提出了一种基于TV模型的自适应图像修复方法,可根据破损区域外部参考像素对待修补点的相关度,通过设置不同的参数和权值,将不同形状的待修复区域所用的不同算法统一表示,使其应用范围更广、速度更快;此外,在迭代过程中,设置不同的参数以解决参数选取的敏感问题,从而达到更好的修复效果。与原方法相比可以有效提高该算法的稳健性,并能显著的减少运算时间。

论文目录

  • 中文摘要
  • Abstract
  • 第1章 绪论
  • 1.1 选题背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 图像修复国内外研究现状
  • 1.2.2 文字提取研究现状
  • 1.3 主要任务
  • 第2章 数字图像修复的基本原理
  • 2.1 图像色彩的处理
  • 2.1.1 颜色处理基础
  • 2.1.2 灰度化处理
  • 2.1.3 颜色量化与减色
  • 2.2 边缘检测
  • 2.2.1 边缘属性
  • 2.2.2 边缘检测算法
  • 2.3 二值化
  • 2.4 数学形态学
  • 2.4.1 腐蚀
  • 2.4.2 膨胀
  • 2.4.3 开启
  • 2.4.4 闭合
  • 2.5 运用数学形态学进行图像的噪声滤除
  • 第3章 文字区域的提取
  • 3.1 系统总体设计框架
  • 3.2 图像的灰度化和二值化处理
  • 3.3 笔画过滤器
  • 3.4 文本颜色极性定义
  • 3.5 局部区域扩展
  • 3.6 OCR 模块反馈
  • 3.7 实验结果
  • 第4章 文字移除后自适应梯度权值的TV 图像修复
  • 4.1 文字区域的后处理
  • 4.2 自适应梯度权值的TV 图像修复
  • 4.2.1 TV 修复模型原理
  • 4.2.2 改进TV 模型的数值解法及参数a 的选择
  • 4.3 实验结果
  • 第5章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 攻读学位期间公开发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    数字图像中文字移除和修复系统的设计和实现
    下载Doc文档

    猜你喜欢