导读:本文包含了文档图像处理论文开题报告文献综述及选题提纲参考文献,主要关键词:跨浏览器兼容性测试,网页分割,文档对象模型,图像处理
文档图像处理论文文献综述
贾柯祯[1](2018)在《基于文档对象模型和图像处理的网页分割方法》一文中研究指出随着互联网技术的发展,Web应用成为了人们日常生活中不可或缺的一部分。大量Web应用以网页为载体,通过浏览器呈现给用户,并与用户进行交互。然而,由于浏览器种类的多样性,不同的浏览器对于相同网页的解释可能不同。这导致相同网页在不同浏览器上的渲染出现差异。当这些差异影响用户体验时,我们称之为兼容性问题。现存的跨浏览器兼容性测试通常先对网页进行分割,再对每个分割进行检查。其中大部分使用文档对象模型,有些也运用图像处理技术。结合基于文档对象模型和基于图像的方法,提出一种新的网页分割方法。该方法得到的网页分割更合理,且计算开销更小。(本文来源于《现代计算机(专业版)》期刊2018年08期)
黄鑫[2](2017)在《特殊类文档的图像处理与字符识别》一文中研究指出OCR技术可将纸质文字信息高速地录入到计算机中,它的研究大大地促进了图像处理、模式识别等学科的发展。OCR技术的诞生有效地解决了信息输入与信息处理间效率不对等的矛盾,提高了计算机系统的整体效率,节省了不必要的劳动力。在信息化进程加速发展的今天,OCR技术已成为非键盘输入技术的首选,为各行各业提供了相应的便捷帮助。OCR技术在识别质量较高的文档图像时,可以保证良好的识别正确率,但在处理低质量的或存在多种字体的文档图像时,识别结果通常不理想,因此对于OCR技术识别这些特殊类文档图像的算法研究仍是亟待解决的课题。本文分析特殊类文档图像特点,发现对于低质量文档图像,需要对当前OCR系统的图像预处理即二值化环节进行改进,而对于多字体文档图像,则更应侧重对汉字识别算法的研究。因此本文研究了大量国内外的二值化算法及字符识别算法,并分别为低质量文档图像及多字体文档图像提出了相应算法,以提高OCR系统的整体识别正确率。主要的研究内容为:第一,为低质量文档图像提出了一种基于区域对比度增强的二值化算法。该算法首先根据像素点的灰度对比度信息通过四叉树原理自适应地进行区域划分,然后对不同属性的区域利用对比度增强法分别进行灰度调整,最后根据区域图像的灰度直方图选取局部阈值。该算法与另四种全局及局部算法进行对比,对DIBCO图像集的所有图片进行仿真,通过定量分析发现本文算法可获得最高的F-measure值及峰值信噪比(PSNR值)。同时将各算法的二值图像输入到ABBYY字符识别软件中,本文算法的二值图像获得最高的识别正确率,高达98.49%。第二,为多字体文档图像提出了一种Gabor变换与小波变换复合的汉字识别算法。该算法首先对待识别图像进行归一化处理,其次提取处理后图像的小波特征及Gabor征特征,最后利用支持向量机作为分类器进行识别分类。本文通过对一级字表中笔画结构不同的100个汉字进行识别,识别正确率可达到98.50%以上。(本文来源于《哈尔滨理工大学》期刊2017-03-01)
王昕[3](2015)在《基于图像处理的文档碎纸拼接技术研究》一文中研究指出碎纸拼接技术是指利用纸质碎块文件所携带的信息,对其进行准确高效的复原。针对由碎纸机规则纵切或是规则横纵切所得碎纸片,通过碎片信息导入、图像边缘提取和骨架特征对比等步骤,给出了基于matlab图像处理的拼接复原方法,以及复原最终的完整效果图。(本文来源于《大学教育》期刊2015年08期)
宋路露[4](2015)在《基于权重规则的图书馆电子文档图像处理研究》一文中研究指出数字图书馆的电子文档图像处理作为一个多学科交叉的研究热点,文档图像识别涉及到了众多邻域,包括人工智能、计算机视觉、图像处理和模式识别等,主要研究了基于智能处理的文档图像识别算法,提出了一种结合权重规则的文档图像识别算法,通过计算文档区域均值像素方差和熵,并由文档分类器获取权值的方法对文档识别有着重要的作用。实验研究证明了方法的有效性。(本文来源于《微型电脑应用》期刊2015年05期)
顾李晶,赵霁[5](2013)在《基于MODI的文档图像处理的研究》一文中研究指出识别文档图像中的文字,有助于人们管理和使用信息。MODI作为Microsoft Office内建的免费文字识别组件,使开发人员可以方便地,以较低的成本处理文档图像。本文通过研究MODI组件的OCR模块的特点和二次开发,以及与其他商业OCR软件的对比,验证了MODI在文档图像处理方面具有较高的可靠性和应用价值。(本文来源于《自动化技术与应用》期刊2013年11期)
王海杰[6](2008)在《文档影像图像处理中的纠偏与降噪研究》一文中研究指出近年来,随着办公自动化即OA系统的广泛使用,档案载体迅速地被磁盘、磁带、光盘所取代或更替。文档影像管理系统通过档案数字化,将票据、单证、文件和档案资料等转换成电子影像信息,存储并索引至光盘或硬盘,用以代替纸张等传统的存储方式,实现档案的数字化存储、管理与维护,提供数字档案信息的网络传输和利用服务。文档影像管理系统在银行业、保险业、政府机关、邮电、医院与教育行业都有广泛的应用,所以文档影像管理系统的研究不仅是一个极具实际意义的课题,而且有着良好的应用发展前景。数字图像处理的结果将形成最终的数字化馆藏,可以说图像处理的质量决定了数字化档案的质量。文档影像系统需要图像处理的问题分两方面:一方面是图像优化,也就是优化扫描图像质量,如降噪,纠偏、去黑边等,一方面是满足特定需求,如处于安全性考虑进行数字水印处理等。本文研究的是第一方面,也就是文档影像系统图像增强中的两个问题:纠偏与降噪。纠偏有分为两个方面:图像纠斜与文本居中。本文提出了基于文本行直线拟合计算文档影像倾斜角度的算法和基于文本区域边界的文本居中算法。文档影像中的噪声(杂点)属于单极脉冲噪声,很多杂点存在于文档影像的“字里行间”中。针对这些特点,本文提出了基于分块快速去除杂点的算法以及为了满足更高影像质量的要求而提出能较大程度去除“字里行间”杂点的基于杂点邻域的降噪算法。最后展示了应用本文中提出算法的一个原型系统。(本文来源于《浙江大学》期刊2008-05-01)
王佐林[7](2007)在《图像分割在文档图像处理中的应用》一文中研究指出文档图像在办公自动化、数字图书馆、电子商务、电子政务、教育等项目中已经广泛应用,在这些应用中,纸质文档通常采用扫描方式得到数字化文档图像进而进行存储和数据处理,纸质文档的信息化是提高数据管理效率、查询效率的重要途径之一。文档图像的处理一般包括:图像预处理、图像分割、图像识别。本文研究了文档图像的分割问题,将图像的文本块与自然图像分离,实现文本图像的行切分和字符切分。基于文档图像的纹理及结构特点,本文先对文档图像进行预处理,使用HOUGH变换检测、定位文档图像的行信息和倾斜角,进行图像的校正,然后使用连通域算法对图像中的目标进行标记,利用文档图像的结构特征和统计特征分割图像,获得纯文本区域,字符的分割使用了连通域、字符结构特征分析等方法,实验数据说明了本文算法的有效性和鲁棒性。本文的工作主要体现在以下几个方面:(1)对自然图像和纯文本文档图像的纹理特征进行了分析,通过量化指标说明文档图像与自然图像之间的差异性。(2)针对文档图像的特点,对文档图像的预处理进行了分析和比较,给出了图像预处理算法的流程图。(3)提出一种新的文档图像分割方法,使用图像的边缘连通域目标数的统计特征分割图像,给出了具体的实现算法。(4)字符分割使用了多种方法,具有更好的实用性。(5)指出本文算法的不足,提出改进建议,对进一步的研究进行了展望。(本文来源于《山东师范大学》期刊2007-10-18)
何希平[8](2004)在《彩色文档图像处理技术》一文中研究指出介绍了文档图像处理技术的研究现状,分析了彩色文档图像不同于二值图像或灰度图像的主要特点,指出了彩色文档图像的压缩处理必须借助于现成的页面分割与分类成果,针对彩色文档图像的特点,改进PLA技术、ACR技术和GLR技术,在努力提高图像质量的前提下,对文档图像按区域类别的不同,选用有针对性的压缩方法,并对实现的技术路线进行了讨论。(本文来源于《重庆工商大学学报(自然科学版)》期刊2004年05期)
张健,张宜群,吕志勇[9](2004)在《VC++6.0下的图像处理及在多文档和无模态对话框中的实时显示》一文中研究指出本文简单介绍了如何使用一个非常实用的类CImageObject对多幅图像进行处理、显示,并将处理结果实时显示在无模态对话框中。(本文来源于《电脑编程技巧与维护》期刊2004年03期)
储开颜,桑宏伟,马田,王朔中[10](2002)在《稀疏矩阵文档图像处理》一文中研究指出讨论基于稀疏矩阵的文档图像存储及处理方法 .采用叁向量法或链表法表示稀疏图像 ,然后在稀疏域直接实现某些基于临域运算的图像处理算法 .分析表明 ,对于具有显着特征的文档图像能有效地节省存储空间并提高计算效率 .以卷积运算和一种文档图像处理运算为例 ,给出实验结果(本文来源于《上海大学学报(自然科学版)》期刊2002年04期)
文档图像处理论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
OCR技术可将纸质文字信息高速地录入到计算机中,它的研究大大地促进了图像处理、模式识别等学科的发展。OCR技术的诞生有效地解决了信息输入与信息处理间效率不对等的矛盾,提高了计算机系统的整体效率,节省了不必要的劳动力。在信息化进程加速发展的今天,OCR技术已成为非键盘输入技术的首选,为各行各业提供了相应的便捷帮助。OCR技术在识别质量较高的文档图像时,可以保证良好的识别正确率,但在处理低质量的或存在多种字体的文档图像时,识别结果通常不理想,因此对于OCR技术识别这些特殊类文档图像的算法研究仍是亟待解决的课题。本文分析特殊类文档图像特点,发现对于低质量文档图像,需要对当前OCR系统的图像预处理即二值化环节进行改进,而对于多字体文档图像,则更应侧重对汉字识别算法的研究。因此本文研究了大量国内外的二值化算法及字符识别算法,并分别为低质量文档图像及多字体文档图像提出了相应算法,以提高OCR系统的整体识别正确率。主要的研究内容为:第一,为低质量文档图像提出了一种基于区域对比度增强的二值化算法。该算法首先根据像素点的灰度对比度信息通过四叉树原理自适应地进行区域划分,然后对不同属性的区域利用对比度增强法分别进行灰度调整,最后根据区域图像的灰度直方图选取局部阈值。该算法与另四种全局及局部算法进行对比,对DIBCO图像集的所有图片进行仿真,通过定量分析发现本文算法可获得最高的F-measure值及峰值信噪比(PSNR值)。同时将各算法的二值图像输入到ABBYY字符识别软件中,本文算法的二值图像获得最高的识别正确率,高达98.49%。第二,为多字体文档图像提出了一种Gabor变换与小波变换复合的汉字识别算法。该算法首先对待识别图像进行归一化处理,其次提取处理后图像的小波特征及Gabor征特征,最后利用支持向量机作为分类器进行识别分类。本文通过对一级字表中笔画结构不同的100个汉字进行识别,识别正确率可达到98.50%以上。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
文档图像处理论文参考文献
[1].贾柯祯.基于文档对象模型和图像处理的网页分割方法[J].现代计算机(专业版).2018
[2].黄鑫.特殊类文档的图像处理与字符识别[D].哈尔滨理工大学.2017
[3].王昕.基于图像处理的文档碎纸拼接技术研究[J].大学教育.2015
[4].宋路露.基于权重规则的图书馆电子文档图像处理研究[J].微型电脑应用.2015
[5].顾李晶,赵霁.基于MODI的文档图像处理的研究[J].自动化技术与应用.2013
[6].王海杰.文档影像图像处理中的纠偏与降噪研究[D].浙江大学.2008
[7].王佐林.图像分割在文档图像处理中的应用[D].山东师范大学.2007
[8].何希平.彩色文档图像处理技术[J].重庆工商大学学报(自然科学版).2004
[9].张健,张宜群,吕志勇.VC++6.0下的图像处理及在多文档和无模态对话框中的实时显示[J].电脑编程技巧与维护.2004
[10].储开颜,桑宏伟,马田,王朔中.稀疏矩阵文档图像处理[J].上海大学学报(自然科学版).2002