论文摘要
随着信息社会数据量的日益增加,人们迫切需要有效的数据挖掘来发现其中的知识。数据挖掘的好坏不仅决定于挖掘的算法有效性,更决定于待挖掘数据的质量。数据预处理可以为数据挖掘提供高质量输入数据,是能够挖掘出有用知识的前提。属性约简是目前数据预处理研究的热点之一。本文针对目前多数属性约简算法只适用于分类输出的局限性,采用启发式属性过滤和学习算法融合验证的打包思想,提出了一种基于双向距离关联法(BDDC)和径向基网络(RBNN)的属性约简算法。算法用本文提出的双向距离关联方法对属性进行重要性评价,根据重要性排序使用改进的加减结合策略进行属性子集选择;然后采用径向基神经网络对已选出的子集进行第二层监督验证。最后,本文采用采用中国城市竞争力数据库及城市气候库对算法的可行性和有效性进行了实验验证。相对于输入输出关联法,基于BDDC和RBNN的属性约简算法具有以下改进:算法提出的BDDC属性重要性度量方法综合考虑纵向和横向输入输出关联,分别针对分类和拟合数据设计了不同的度量函数,而且纵向关联综合考虑到纵向输入输出变化的大小及方向,横向关联计算了输入输出的直接横向因果联系,兼顾了属性的不平等性。算法采用局部逼近的径向基网络(RBNN)作为选择验证工具,并根据数据特点设计了不同的网络输出,网络的学习采用聚类、梯度法与正交最小二乘法三者的选择式混合学习算法。算法在BDDC重要性排序和网络性能函数的双重监督下,采用改进的加减结合策略(IASCS)选择属性子集,提高了效率。
论文目录
摘要Abstract第一章 绪论1.1 数据挖掘与数据预处理1.1.1 数据挖掘概述1.1.2 数据挖掘与数据预处理1.1.3 课题的提出1.2 属性约简的发展现状1.2.1 属性约简概述1.2.2 属性子集选择1.2.3 属性重要性度量1.2.4 学习算法1.2.5 搜索策略1.3 课题来源1.4 论文内容和结构第二章 属性约简2.1 数据预处理2.1.1 数据质量与数据预处理2.1.2 数据预处理的功能和策略2.1.3 数据预处理主要方法2.2 属性约简2.2.1 属性子集选择2.2.2 启发式属性子集选择2.2.3 属性重要性度量和属性子集的评价2.2.4 属性约简算法研究现状和问题第三章 径向基神经网络3.1 引言3.2 多层前向BP网络3.2.1 BP神经网络的原理3.2.2 BP神经网络的缺点3.3 径向基神经网络3.3.1 径向基网络的理论基础3.3.2 径向基函数3.3.3 RBNN的拓扑结构与原理3.3.4 RBNN的学习方法第四章 基于双向距离关联和径向基网络的属性约简4.1 引言4.2 属性重要性度量4.2.1 分离联系法4.2.2 输入输出关联法4.2.3 双向距离关联法4.3 径向基神经网络的设计4.4 基于BDDC度量和RBNN的属性约简思想4.4.1 数据准备4.4.2 属性约简4.5 基于BDDC和RBNN的属性约简算法描述4.5.1 算法流程图4.5.2 算法伪代码4.6 本章小结第五章 算法仿真验证5.1 中国城市竞争力数据库5.1.1 数据库介绍5.1.2 属性约简5.2 中国内地城市竞争力数据库5.3 中国主要城市气候数据库总结参考文献攻读硕士学位期间发表的学术论文致谢
相关论文文献
标签:数据预处理论文; 属性约简论文; 双向距离关联论文; 径向基神经网络论文; 双重监督属性选择论文; 混合网络学习论文;
基于双向距离关联和径向基神经网络的属性约简算法研究
下载Doc文档