论文摘要
信函自动分拣是机器视觉技术的应用,是邮政自动化的一个重要环节,它直接决定了邮政是否能够实现自动化,是否能满足日益增加的信件处理需求。信函自动分拣涉及到很多机器视觉技术和图像处理技术,包括图像的采集、文本图像分析、版面分析、模式识别等。本论文面对如此背景和需求驱动,针对实际应用——中国邮政承担的孟加拉信函分拣系统的需求,提出了孟加拉信封图像的邮政编码定位技术,包括基于边缘特征分析的框内定位和基于质心、蓄水池等特征的框外目标地址块中的邮政编码定位。山于孟加拉是一个多语言国家,英文和孟加拉文,而不同语言对应的数字也不同,因此分割出邮政编码图像后进行OCR识别之前还需要进行信封的语言辨别。基于这种背景和需求,本文提出了一种基于连通元轮廓分析的能够有效区分英文/孟加拉文的语言辨别技术。本论文首先从系统的角度介绍了孟加拉信函分拣机的整个流程和孟加拉信封图像处理系统的各个模块。接着,讲述信封图像的预处理技术,提出一种基于改进的边缘检测方法的邮框的定位分割方法,并从邮框中分割出邮政编码。然后,根据版面分析的一些方法从信封图像从提取出目标地址块,并从所得到的目标地址块中进行邮政编码的定位分割,同时提出一种基于蓄水池、连通元质心等特征的粘连数字的分割方法。最后,分析了目前语言辨别领域中已提出的一些语言辨别的方法及其优缺点,并提出了一种新的能最有效地辨别孟加拉信封语言的语言辨别方法。