导读:本文包含了公式符号切分论文开题报告文献综述及选题提纲参考文献,主要关键词:数学公式识别,深度学习,粘连符号,切分
公式符号切分论文文献综述
郭蓉蓉,李涛,魏琦[1](2019)在《基于深度学习的数学公式粘连符号的切分》一文中研究指出粘连符号切分一直是数学公式识别中的重要问题,也是造成识别错误的主要原因之一,针对这种情况论文用深度学习对粘连符号进行了分割。使用FasterRCNN神经网络进行有监督训练,在训练数据集中包含各种粘连情况,如:水平粘连、垂直粘连以及对角线粘连等,对特殊的粘连情况另外做特殊的处理。通过实验表明这种分割方法使得粘连符号的切分得到显着的提高,同时也提高了数学符号识别的正确率。(本文来源于《计算机与数字工程》期刊2019年10期)
张艳[2](2008)在《印刷体数学公式符号切分的研究》一文中研究指出目前主流OCR (Optical Character Recognition,光学字符识别)技术虽然能够高速、自动地将印刷体文字信息输入计算机,但对于结构复杂、符号多变的数学公式仍然无能为力。数学公式是科技文献的重要组成部分,因此,数学公式识别问题已经成为模式识别领域炙手可热的课题。印刷体数学公式识别系统包括公式抽取、公式符号识别、公式结构分析和公式重构四个组成部分。其中,数学公式符号识别是公式识别系统的核心部分,分为符号切分和符号识别两个阶段,而符号切分又是关键的一个环节。本文针对印刷体数学公式符号切分展开研究。首先设计并实现了一个能够处理公式二维嵌套结构的符号切分算法;然后基于识别结果以及粘连符号的特点,给出了一种基于轮廓特征的印刷公式粘连符号切分方法,通过检测粘连符号的凹凸轮廓以及轮廓的宽高比,并结合给出的粘连符号切分算法对粘连符号进行切分。通过对不同印刷质量文档的实验表明,本文设计的符号切分方法能够取得较高的切分正确率和令人满意的处理速度。(本文来源于《河北大学》期刊2008-06-01)
田学东,张艳,王亮[3](2008)在《基于轮廓特征的印刷公式粘连符号的切分》一文中研究指出在印刷体数学公式识别中,不能准确地切分粘连符号是造成识别错误的主要原因之一。针对这种情况,提出了一种基于轮廓特征切分粘连符号的方法。根据轮廓特征及宽高比形成切分路径,然后对粘连字符切分。实验表明,这种方法使识别率得到了明显提高。(本文来源于《计算机工程与应用》期刊2008年04期)
田钢,伊开,陈武,田学东[4](2007)在《基于组合策略的印刷公式符号切分方法》一文中研究指出对公式符号切分这一公式识别的关键环节进行研究.归纳、总结了公式符号的分布规律,提出了将符号分离与符号合并策略相结合,提取公式符号的方法,对具有包含关系的符号进行分离操作,而对由多个连通部件构成的符号进行合并处理.实验表明,该方法能够较好地适应公式特点,具有较高的准确性.(本文来源于《河北大学学报(自然科学版)》期刊2007年03期)
李海燕[5](2007)在《印刷体数学公式符号的切分与识别》一文中研究指出科技文献作为记录科学技术信息的载体,对其进行数字化是建设信息化社会的迫切需要。目前广泛应用的OCR (Optical character recognition,光学字符识别)技术可以将印刷体文献中的文字高速、自动地输入计算机,且取得很高的识别率。但是科技文献中包含大量的数学公式,OCR还不能对其进行正确识别,只能将其存储为图片格式,不仅占用大量空间,而且不能对其进行再编辑。因此,数学公式自动识别在将科技文献转化为电子文档的过程中具有重要的意义。印刷体数学公式识别系统包括公式抽取、公式符号识别、公式结构分析和公式重构四个组成部分。其中,公式符号识别模块是系统的核心部分,其功能是将公式中的符号图像转换成相应的代码,分为符号切分和符号识别两个阶段。针对传统的文字识别器在识别公式符号中存在的问题,本文对印刷体数学公式符号切分和识别展开研究,设计了能够适应公式符号二维分布、大小不一、多交迭、多字体等特点的切分和识别算法。首先采用迭代自组织的符号切分方法对公式符号进行切分,为符号识别提供正确的符号位置信息;然后对符号进行预处理,并采用基于游程特征的符号识别方法对公式符号进行识别。通过对不同印刷质量文档的实验表明,本文设计的符号切分和识别方法能够取得较高的识别率和令人满意的处理速度。(本文来源于《河北大学》期刊2007-05-01)
公式符号切分论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目前主流OCR (Optical Character Recognition,光学字符识别)技术虽然能够高速、自动地将印刷体文字信息输入计算机,但对于结构复杂、符号多变的数学公式仍然无能为力。数学公式是科技文献的重要组成部分,因此,数学公式识别问题已经成为模式识别领域炙手可热的课题。印刷体数学公式识别系统包括公式抽取、公式符号识别、公式结构分析和公式重构四个组成部分。其中,数学公式符号识别是公式识别系统的核心部分,分为符号切分和符号识别两个阶段,而符号切分又是关键的一个环节。本文针对印刷体数学公式符号切分展开研究。首先设计并实现了一个能够处理公式二维嵌套结构的符号切分算法;然后基于识别结果以及粘连符号的特点,给出了一种基于轮廓特征的印刷公式粘连符号切分方法,通过检测粘连符号的凹凸轮廓以及轮廓的宽高比,并结合给出的粘连符号切分算法对粘连符号进行切分。通过对不同印刷质量文档的实验表明,本文设计的符号切分方法能够取得较高的切分正确率和令人满意的处理速度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
公式符号切分论文参考文献
[1].郭蓉蓉,李涛,魏琦.基于深度学习的数学公式粘连符号的切分[J].计算机与数字工程.2019
[2].张艳.印刷体数学公式符号切分的研究[D].河北大学.2008
[3].田学东,张艳,王亮.基于轮廓特征的印刷公式粘连符号的切分[J].计算机工程与应用.2008
[4].田钢,伊开,陈武,田学东.基于组合策略的印刷公式符号切分方法[J].河北大学学报(自然科学版).2007
[5].李海燕.印刷体数学公式符号的切分与识别[D].河北大学.2007