论文题目: 遗传算法在数据挖掘中的应用
论文类型: 硕士论文
论文专业: 计算机应用技术
作者: 贺琦
导师: 胡金初
关键词: 数据挖掘,遗传算法,聚类
文献来源: 上海师范大学
发表年度: 2005
论文摘要: 随着计算机技术和信息技术的发展,信息的增长速度呈现指数上升,最近几十年产生了很多超大型数据库,遍及超级市场销售、银行存款、行政办公及科学研究。信息量的急剧增长,使传统分析方法远远不能满足现实的需求。面对海量数据,如何从中发现有价值的信息或知识,成为一项非常艰巨的任务。人们急切的需要一种去粗存精、去伪存真的技术,能够从海量的数据中提取知识和信息的数据挖掘技术应运而生。 数据挖掘(Data Mining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是一个交叉学科领域,集成了数据库、人工智能、数理统计、可视化、并行计算等技术。 数据挖掘是应用需求推动下跨学科发展的产物,而且在近几年里迅速发展起来。这个领域的实质是智能技术与数据库技术的结合,不但为决策者提供知识和策略,而且为投资者带来经济效益。 现在应用于数据挖掘的算法有许多种,但是许多数据挖掘算法都涉及以下问题:数据的不完整、不精确以及不确定,即从不一致的例子中如何提取规则;规则的有效性,即在挖掘中出现很多无用的规则的处理;规则选优,在规则发生冲突时如何选择;以及误差控制,算法效率等。 遗传算法(genetic algorithmn,GA)由于其解决问题以混沌、随机和非线性为典型特征,为其它科学技术无法解决或难以解决的复杂问题提供了新的计算模型。对于大量数据的嘈杂无序的特征,遗传算法是有效解决此类问题的方法之一。它模拟自然选择和生物遗传机制,利用遗传算子产生后代,通过群体的迭代,使个体的适应性不断提高,最终群体中适应值最高的个体即是优化问题的最优或次优解。 本文首先概括地介绍了数据挖掘技术,对其任务、方法及面临的问题与挑战等进行了过论;然后,引入了遗传算法,探讨了其基本要素、特点及研究现状与方向等,并针对其局限性,提出了一系列的改进方法:采用分阶段快速寻优、调整控制参数、实数编码、协同进化、协同多群体遗传算法,粗粒度遗传算法及混
论文目录:
目录
摘要
Abstract
第1章 绪论
1.1 数据挖掘技术产生的背景
1.2 遗传算法的研究及应用
1.3 遗传算法与数据挖掘
1.4 论文内容的组织和结构
第2章 数据挖掘技术概述
2.1 引言
2.2 数据挖掘的定义
2.3 数据挖掘的目的
2.4 数据挖掘的任务
2.4.1 关联分析
2.4.2 时序模式
2.4.3 聚类
2.4.4 分类
2.4.5 偏差检测
2.4.6 预测
2.5 数据挖掘的过程
2.6 数据挖掘的方法
2.7 数据挖掘的应用领域
2.8 数据挖掘的研究热点
2.9 数据挖掘面临的问题与挑战
第3章 遗传算法及其改进
3.1 遗传算法的基本概念
3.2 遗传算法的处理流程及基本要素
3.2.1 问题编码
3.2.2 初始群体的生成
3.2.3 适应值函数的确定
3.2.4 遗传算子
3.3 遗传算法的设计
3.4 遗传算法的特点
3.5 遗传算法的研究现状与方向
3.6 遗传算法的局限性
3.7 遗传算法的改进
3.7.1 分阶段快速寻优
3.7.2 调整控制参数
3.7.3 协同进化
3.7.4 采用实数编码
3.7.5 协同多群体遗传算法
3.7.6 粗粒度遗传算法(并行遗传算法)
3.7.7 混合粗粒度遗传算法
第4章 遗传算法在数据挖掘(聚类)中的应用
4.1 数据聚类及聚类技术
4.1.1 聚类的定义
4.1.2 相似性度量
4.1.3 什么是一个好的聚类方法
4.1.4 数据挖掘对聚类的要求
4.1.5 聚类分析中的数据类型
4.1.6 聚类技术
4.1.7 聚类的应用
4.2 遗传算法用于数据聚类
4.2.1 k-means聚类算法的弊端及基于遗传算法的聚类算法的提出
4.2.2 基于遗传算法的聚类算法的总体设计
4.2.3 基于遗传算法的聚类算法的实现
4.2.4 基于遗传算法的聚类算法的应用
第5章 总结与展望
5.1 总结
5.2 进一步的工作
参考资料
硕士期间发表的文章
硕士期间参加的实践
致谢
论文独创性声明
论文使用授权声明
发布时间: 2006-10-20
参考文献
- [1].基于遗传算法的数据挖掘技术研究[D]. 姜延丰.东北师范大学2005
- [2].数据挖掘技术在医院信息系统中的应用研究[D]. 方明.湖南大学2015
- [3].基于数据挖掘技术的客户离网模型研究[D]. 龙艳.贵州大学2008
- [4].数据挖掘技术在故障诊断中的应用[D]. 于博文.东北石油大学2015
- [5].数据挖掘技术在电网调度自动化系统中应用的研究[D]. 赵云.华北电力大学(北京)2004
- [6].数据挖掘技术在高校学生综合素质分析中的应用研究[D]. 俞启祥.华侨大学2017
- [7].数据挖掘技术在高校学生成绩管理系统中的应用[D]. 单联臣.大连交通大学2015
- [8].数据挖掘技术在税收风险管理系统中的应用研究[D]. 郑永强.华北水利水电大学2018
- [9].基于Spark框架的大规模数据挖掘技术研究[D]. 桂伟.安徽工业大学2018
- [10].基于数据挖掘技术的某图书馆书籍推荐系统[D]. 曾胜海.西华大学2017
相关论文
- [1].基于遗传算法的关联规则数据挖掘的应用研究[D]. 薛慧君.天津大学2006
- [2].面向数据挖掘的遗传算法的研究与应用[D]. 盛文峰.上海交通大学2007
- [3].基于遗传算法的数据挖掘技术研究[D]. 杨丽娜.西安建筑科技大学2007
- [4].遗传算法与关联规则挖掘算法研究与应用[D]. 高丽.华中师范大学2007
- [5].遗传算法在数据挖掘中的研究与应用[D]. 李余琪.中南大学2007
- [6].基于粗糙集和遗传算法的空间数据挖掘技术研究[D]. 刘潭仁.重庆大学2004
- [7].基于遗传算法的数据挖掘技术研究[D]. 姜延丰.东北师范大学2005
- [8].Hopfield网络、遗传算法的数据挖掘中的应用[D]. 张聪.山东师范大学2006
- [9].一种基于遗传算法的数据挖掘技术的研究与应用[D]. 安磊.河海大学2001
- [10].面向数据挖掘的遗传算法的研究与应用[D]. 石先军.武汉大学2003