论文摘要
信息时代的来临,带来大量的数据。这些数据中隐藏着许多重要的信息和知识。如何从表面数据中提取到深层次的、表现了事物内在规律的规则来进行预测或指导决策,是迫切需要解决的问题。数据挖掘正是在这样的背景下产生的新的研究领域,是统计学、计算机科学、模式识别、人工智能、机器学习、数据库等多领域的交叉学科。规则提取是数据挖掘领域的一个重要课题。本文就数据挖掘中的规则提取问题进行了相关的研究。首先,讨论了连续属性离散化问题。连续属性离散化是否合理决定着表达和提取相关信息的准确性。CHI2系列算法关联着统计学理论方法,有着重要的研究价值。在对CHI2系列算法中统计量x 2应用意义讨论的基础上,提出了一种新的Intelgal-CHI2算法,能够更合理更准确的对连续属性进行离散化。其次,研究以免疫算法为工具对信息系统进行规则提取。在免疫算法中结合了小生境技术的共享机制,利用了共享机制中对资源的共享和竞争原理,体现了规则之间竞争与互补的关系。针对普通可信度度量方法的不足,提出了柔性可信度的概念和度量方法,能够获得更好的规则。最后,本文研究了从神经网络中进行规则提取的问题。神经网络是一种非常好的数据挖掘工具,具有良好的非线性处理能力。但神经网络学习到的信息是蕴涵在大量的连接权中,很难被理解。本文提出了一种基于神经网络的、对信息系统进行规则提取的新方法。该方法是多项式级的,并且可以处理离散型变量。
论文目录
摘要Abstract第一章 绪论1.1 引言1.2 数据挖掘的研究现状1.3 论文组织结构第二章 数据挖掘中规则提取问题相关技术与理论2.1 数据挖掘2.1.1 数据挖掘的定义2.1.2 数据挖掘的功能2.1.3 数据挖掘常用方法2.2 数据挖掘中的规则提取问题2.2.1 连续属性离散化2.2.2 基于免疫算法的规则提取2.2.3 基于神经网络的规则提取第三章 连续属性离散化 CH12 方法研究3.1 引言3.2 数理统计基本理论和离散化过程中的基本概念3.2.1 数理统计基本理论3.2.2 离散化过程中的基本概念3.3 连续属性离散化的CH12 系列算法3.4 Integral-CH12 算法3.5 实验与讨论3.6 小结第四章 基于小生境免疫算法的柔性可信度规则提取方法研究..4.1 引言4.2 基本理论4.2.1 免疫算法4.2.2 小生境理论4.3 规则的表示方法和重要性的度量4.3.1 规则的表示方法4.3.2 规则的重要性度量4.4 小生境共享机制的实现方法4.5 基于免疫算法的规则提取4.6 实验与结论4.7 小结第五章 基于 BP 神经网络的规则提取方法研究5.1 引言5.2 BP 神经网络的基本理论5.2.1 神经元5.2.2 神经网络5.2.3 误差反传(BP)算法5.3 神经网络中规则提取相关研究进展5.4 基于BP 神经网络的规则提取5.4.1 规则表示方法5.4.2 相邻两层间的规则提取5.4.3 规则空间启发式的搜索5.4.4 具体算法步骤5.5 算例与实验5.5.1 算例5.5.2 实验结果5.6 小结第六章 结论与展望6.1 总结6.2 展望参考文献致谢攻读硕士学位期间撰写和发表的学术论文
相关论文文献
标签:数据挖掘论文; 规则提取论文; 连续属性离散化论文; 免疫算法论文; 神经网络论文;