论文摘要
由于INTERNET和数字化技术的不断发展,INTERNET上所包含的信息也在飞速的增加,INTERNET已经成为包含各种信息形式,如文本、图像,音频等多媒体的巨大的信息资源库。而WEB图像信息的利用也越来越受到人们的关注,因此WEB图像信息资源的有效利用也是目前急需要解决的问题,因为这不但可以高效的帮助网络用户找到它们所需要的信息,而且还可以帮助解决INTERNET上图像噪音的过滤问题。然而由于WEB图像从主题、格式、到功能和来源是不同的,所以很难用一个统一的标准对其进行分类,并进行有效的检索。因此,目前对WEB图像的分类研究主要是针对某一范围进行的,当然这也限制了对WEB图像的有效利用。本研究的目的是建立一个高效的WEB图像分类器,实现对INTERNET上WEB图像的高速有效分类。采用的分类算法是数据挖掘算法中的神经网络分类算法,并对其进行了一定的优化,采用了弹性BP算法。由于从HTML文件中得到的属性值存在缺失的情况,而这正好可以利用神经网络算法的特点,因为神经网络具有很强的鲁棒性和容错性。实验通过训练集建立神经网络,再用此神经网络来对测试集里的图像进行分类。实验结果表明该WEB图像分类器经过不断的重复训练,具有很强的自适应性,能够以较高的准确率对任意WEB图像进行分类。第一章绪论部分扼要地阐述了本课题研究的背景和意义,以及研究的目的。第二章介绍了图像分类的方法及其所运用的相关算法,使读者对WEB图像分类有大概的了解。第三章主要介绍了本研究的总体设计和研究方案。第四章主要介绍了用于获取实验数据的信息采集模型。第五章重点介绍了用于实验的神经网络算法的概述,原理等等。第六章详细介绍了用于实验的神经网络模型的设计与优化,并且给出了实验的相关数据与结果。第七章根据实验结果对此研究做了一个综合的评价,并对未来研究作出展望。实验系统的开发环境是Windows XP,开发平台是Visual C++和MS SOL Server2000。
论文目录
摘要ABSTRACT第1章 绪论1.1 选题的研究背景和意义1.2 研究的意义和内容1.3 研究的目的第2章 图像分类方法的研究2.1 图像分类概述2.1.1 基于文本的图像分类2.1.2 基于内容的图像分类2.2 基于数据挖掘算法的图像分类方法2.2.1 数据挖掘概述2.2.2 数据挖掘的功能2.2.3 数据挖掘系统的分类2.3 基于SVM算法的图像分类2.4 基于决策树算法的图像分类2.5 基于贝叶斯(Bayes)算法的图像分类2.6 分类算法的评价标准2.7 本章小结第3章 总体设计和研究方案3.1 本课题的主要研究目的内容3.2 INTERNET数据采集模块3.3 建立神经网络模型3.4 系统开发设计平台3.5 本章小结第4章 实验数据的获取与数据预处理4.1 INTERNET信息采集模块4.1.1 WEB页面的HTML文档的采集4.1.2 WEB页面属性的获取4.1.3 图像高度,高度,ALT,SRC,HREF属性的获取4.1.4 图像说明文字的提取4.2 图像属性的处理及计算4.2.1 图像的SRC,HREF属性的计算4.2.2 图像说明文字、ALT文本和网页标题的分词4.2.3 图像链接属性的计算4.2.4 图像高度与宽度比的计算4.3 本章小结第5章神 经网络技术5.1 神经网络综述5.2 生物神经元的基本原理5.3 人工神经网络概述5.4 人工神经网络算法的功能5.5 人工神经网络在分类预测中的应用5.5.1 人工神经网络在市场组合法中的应用5.5.2 目标识别分类的应用5.5.3 焊接接头力学性能预测中的应用5.6 BP神经网络原理5.7 BP网络的学习过程5.8 BP神经网络分类模型的算法推导5.9 本章小结第6章 神经网络模型的设计与优化6.1 BP网络在本研究中的应用6.1.1 WEB图像的初步分类以及输入属性的确定6.2 辅助工具的确定6.2.1 MATLAB的简介6.2.2 MATLAB的ANN工具箱6.3 BP网络的优化及改进6.4 预测模型的设计6.5 系统构架6.5.1 系统主界面6.5.2 数据采集模块界面6.6 系统实验6.7 本章小节第7章 系统评测7.1 系统性能分析7.2 总结展望第8章 结束语参考文献致谢
相关论文文献
标签:神经网络论文; 图像分类论文; 信息提取论文;