基于SVM的验证码识别算法研究

基于SVM的验证码识别算法研究

论文摘要

20世纪90年代初期,由Vapnik等人所提出的支持向量机(SVM)是在统计学理论基础上发展进而产生的一个崭新的学习系统,在文本分类、手写字符识别、图像分类、生物序列分析等实际应用中具有很高的泛化学习性能。随着在理论方面不断深入,在实践中不断发展,SVM目前已成为机器学习和数据挖掘领域的标准工具。基于支持向量机的验证码识别在电子商务中有着广泛应用。电子商务的发展非常迅速,迫切需要一种推广方式来推销他们的商品,残障人士上网问题也需要迫切关注,因此许多人开始研究网络机器人技术,用于邮箱自动注册,群发信息,自动灌水,自动登录等功能,而这些功能都离不开验证码识别技术,验证码识别技术已成为当前这一领域的一个研究热点。本文详细介绍了支持向量机的基础理论、算法实现策略、模型和参数选择,研究了验证码图像处理、特征提取及验证码识别的具体方法,设计并实现了验证码识别方案,在验证码识别过程中取得了良好的效果。本文首先概述统计学习理论和支持向量机的构造方法,分析和研究了支持向量机的多类分类算法和核函数方法。其次,介绍了图像处理的各种基本算法,对验证码图像处理遇到的问题进行了分析,并采取不同的方法使验证码处理达到较好效果,方便了验证码特征向量的提取,同时还分析了几种不同的验证码特征提取方法的优劣。再次,介绍了SVM多类分类器的详细设计过程,分析了实现过程过程中遇到的情况,设计了良好的数据结构用来存储向量数据,提供了SVM训练接口和预测接口,分别用来训练支持向量机和预测分类结果。最后,综合以上理论,设计出基于C++的SVM算法,同时实现了验证码识别系统。从各类不同网站上下载具有典型特征的验证码进行实验的结果表明,该系统可非常有效地识别目前网络上流行的各类验证码。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.1.1 机器学习的发展
  • 1.1.2 图像处理与应用
  • 1.2 支持向量机概述
  • 1.2.1 支持向量机的研究内容
  • 1.2.2 支持向量机发展状况
  • 1.3 验证码识别方法研究
  • 1.3.1 验证码识别的意义
  • 1.3.2 验证码识别的方法
  • 1.4 研究内容和组织结构
  • 1.4.1 研究的主要内容
  • 1.4.2 论文的组织结构
  • 第二章 SVM算法理论
  • 2.1 统计学习
  • 2.1.1 经验风险最小
  • 2.1.2 学习过程一致性
  • 2.1.3 VC维理论
  • 2.1.4 结构风险最小
  • 2.2 线性SVM
  • 2.2.1 线性问题
  • 2.2.2 线性分类器
  • 2.3 非线性SVM和核函数
  • 2.3.1 非线性SVM
  • 2.3.2 核函数方法
  • 2.3.3 核函数的选择
  • 2.4 SVM多类分类
  • 2.4.1 多类问题
  • 2.4.2 多类分类方法
  • 2.5 SMO和选择工作集算法
  • 2.5.1 SMO算法
  • 2.5.2 选择工作集算法
  • 2.6 常用的SVM类型
  • 2.6.1 C-SVC
  • 2.6.2 v-SVC
  • 2.6.3 on-class SVM
  • 2.6.4 ε-SVR
  • 2.6.5 v-SVR
  • 第三章 验证码图像处理算法
  • 3.1 图像预处理
  • 3.1.1 图像平滑
  • 3.1.2 中值滤波
  • 3.1.3 直方图均衡
  • 3.1.4 图像锐化
  • 3.1.5 图像灰度化
  • 3.1.6 图像二值化
  • 3.1.7 去除噪音
  • 3.2 形态学图像处理
  • 3.2.1 图像的腐蚀
  • 3.2.2 图像的膨胀
  • 3.2.3 图像的细化
  • 3.3 图像分割
  • 3.3.1 基于区域的分割
  • 3.3.2 基于分水岭的分割
  • 3.3.3 基于投影的分割
  • 3.4 特征提取
  • 第四章 SVM分类器设计
  • 4.1 改进的SMO和工作集选择算法
  • 4.2 SVM设计和实现
  • 第五章 验证码识别
  • 5.1 验证码识别过程
  • 5.1.1 识别的流程
  • 5.1.2 样例的制作
  • 5.1.3 样例的训练
  • 5.1.4 识别验证码
  • 5.2 验证码识别系统框架
  • 5.2.1 系统框架
  • 5.2.2 图像预处理模块
  • 5.2.3 特征提取模块
  • 5.2.4 支持向量机模块
  • 5.3 验证码识别实验
  • 5.4 验证码识别实验分析
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 攻读硕士期间发表的论文
  • 相关论文文献

    • [1].基于人工鱼群算法的孪生支持向量机[J]. 智能系统学报 2019(06)
    • [2].基于改进支持向量机的温室大棚温度预测[J]. 科技创新与应用 2020(10)
    • [3].结构化支持向量机研究综述[J]. 计算机工程与应用 2020(17)
    • [4].支持向量机理论及应用[J]. 科学技术创新 2019(02)
    • [5].加权间隔结构化支持向量机目标跟踪算法[J]. 中国图象图形学报 2017(09)
    • [6].多分类孪生支持向量机研究进展[J]. 软件学报 2018(01)
    • [7].模糊型支持向量机及其在入侵检测中的应用[J]. 科技创新与应用 2018(11)
    • [8].从支持向量机到非平行支持向量机[J]. 运筹学学报 2018(02)
    • [9].支持向量机的基本理论和研究进展[J]. 长江大学学报(自科版) 2018(17)
    • [10].孪生支持向量机综述[J]. 计算机科学 2018(11)
    • [11].一种新的基于类内不平衡数据学习支持向量机算法[J]. 科技通报 2017(09)
    • [12].分段熵光滑支持向量机性能研究[J]. 计算机工程与设计 2015(08)
    • [13].有向无环图-双支持向量机的多类分类方法[J]. 计算机应用与软件 2015(11)
    • [14].基于支持向量机的股票价格预测模型研究与应用[J]. 课程教育研究 2016(28)
    • [15].灰狼优化的混合参数多分类孪生支持向量机[J]. 计算机科学与探索 2020(04)
    • [16].基于属性约简—光滑支持向量机的中小企业信息化评价研究[J]. 软件工程 2020(07)
    • [17].基于稀疏孪生支持向量机的人脸识别[J]. 信息技术 2020(07)
    • [18].基于总类内分布的松弛约束双支持向量机[J]. 济南大学学报(自然科学版) 2018(04)
    • [19].基于多分类支持向量机的评估模型研究[J]. 数学的实践与认识 2017(01)
    • [20].改进的支持向量机在微博热点话题预测中的应用[J]. 现代情报 2017(03)
    • [21].多核在线支持向量机算法研究及应用[J]. 宜宾学院学报 2017(06)
    • [22].基于改进遗传算法的支持向量机参数优化方法[J]. 计算机与现代化 2015(03)
    • [23].一种层次粒度支持向量机算法[J]. 小型微型计算机系统 2015(08)
    • [24].自训练半监督加权球结构支持向量机多分类方法[J]. 重庆邮电大学学报(自然科学版) 2014(03)
    • [25].四类基于支持向量机的多类分类器的性能比较[J]. 聊城大学学报(自然科学版) 2014(03)
    • [26].一种模糊加权的孪生支持向量机算法[J]. 计算机工程与应用 2013(04)
    • [27].一种采用粗糙集和遗传算法的支持向量机[J]. 山西师范大学学报(自然科学版) 2013(01)
    • [28].基于在线支持向量机的无人机航路规划技术[J]. 电光与控制 2013(05)
    • [29].贪婪支持向量机的分析及应用[J]. 计算机工程与应用 2012(24)
    • [30].一种改进的双支持向量机[J]. 辽宁石油化工大学学报 2012(04)

    标签:;  ;  ;  ;  

    基于SVM的验证码识别算法研究
    下载Doc文档

    猜你喜欢