论文摘要
随着计算机科学、多媒体技术的飞速发展,以数字图像为主的多媒体信息迅速成为重要的通用信息媒体。在数字图像中,文字信息(如新闻标题、旁白和广告词等等)包含了丰富的高层语义信息,自动提取出这些文字,首先对它们识别和分析,对于图像高层语义的索引和检索是非常有帮助的。此外,将提取出的文字从原图中去除,可修复被文字所遮挡的背景区域,使其恢复原来的面貌,甚至再添加上多语种的文字,这对于不同语种间的交流和图像的再次使用也是很有意义的。本文主要对于数字图像中文字的移除和修复系统的设计及实现,其工作体现在:(1)文字的移除。在已有图像文字提取算法进行研究的基础上,利用文字区域与图像背景之间存在着明显的边缘轮廓这一实际情况,提出了基于笔画过滤器、颜色极性判断和OCR模块反馈的文字区域提取算法。该算法运用笔画过滤器对文字进行初步提取,然后用灰度极性判断来增强文字提取的可靠性,最后靠OCR反馈来进一步提示文字提取的性能。实验结果证明,该算法非常有效,文字提取率高,且具有鲁棒性。(2)在提取出图像内的文字区域后,对原来文本遮挡的区域进行修复。基于TV模型的修复方法有较好的恢复效果,但对参数的选取比较敏感,且运算量较大等问题,提出了一种基于TV模型的自适应图像修复方法,可根据破损区域外部参考像素对待修补点的相关度,通过设置不同的参数和权值,将不同形状的待修复区域所用的不同算法统一表示,使其应用范围更广、速度更快;此外,在迭代过程中,设置不同的参数以解决参数选取的敏感问题,从而达到更好的修复效果。与原方法相比可以有效提高该算法的稳健性,并能显著的减少运算时间。